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METHODE DE GESTION DES REORGANISATIONS DANS UN ENSEMBLE 
DE BASES DE DONNEES INDEXEES D' UN SYSTEME INFORMATIQUE 
D' INFORMATION 



La presente invention concerne la reorganisation de 
bases de donnees g6rees a l'aide d'un systeme 
inf ormatique, plus particulierement les bases de donn6es 

10 indexees dans lesquelles un index, le plus souvent sous 
forme de table d'indfcx, est utilise pour acceder £ un 
objet recherch6, par exemple une ligne de la base de 
donnees. Ces bases de donnees peuvent etre de tres 
grande taille. Pour fixer les idees et sans caractere 

15 limitatif pour la presentation de 1' invention la' taille 
de ces bases de donnees de tres grandes tallies peut 
aller de un million a quelques milliards de lignes* Ces 
bases de donnees sont en general enregistrees dans des 
memoires de grande capacite, par exemple des memoires a 

20 disque, chaque ligne de donn§es 6tant adressee de fagon 
appropriee. Les tallies considerables que peuvent avoir 
les bases de donnees requierent souvent 1' exploitation 
de ces dernidres par partitions auxquelles sont associes 
des index de partitions specifiques et/ou les index de 

25 bases de donnees completes. 

II est capital, pour maintenir la capacity d' une base de 
donnees & etre consul t6e par une connexion en ligne (on 
line) avec un temps d'acces aux donnees raisonnable, 
30 malgre l'effet retardateur du aux mises a jour 
pratiquees sur la base, de proceder a des 
reorganisations periodiques de cette base de donnees, 

La reorganisation est une etape essentielle dans 
35 1'entretien des bases de donnees (et de leurs index) • La 
reorganisation est faite hors ligne (off line) en 
general pendant la fenetre de maintenance (fenetre 
« batch ») et consiste a decharger la base de donnees, a 
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* • 

ranger ses lignes d' information dans un ordre souhaite, 
par exemple 1' ordre alphabetique, puis a recharger les 
lignes une fois rangees dans la base de donnees en 
mettant a jour les index, si possible de fagon 
5 reorganisee. 

Pour la suite de 1' expose on appellera indistinctement 
« objet £ r^organiser » OR un objet susceptible de 
reorganisation d 7 un systeme d' inf ormation, en 
10 particulier la base de donnee seule, son ou ses index, 
1' association base de donnees et index f les partitions 
de la bases de donnees, leurs index associes 
(sp<§cif iques ou non) et les associations partitions et 
leurs index, 

15 : 

De meme pour la suite de 1' expose , on appellera systeme 
informatique d' inf ormation ou systeme d f inf ormation un 
systeme informatique complet (materiels et logiciels) 
adapte pour la gestion de bases de donnees et comport ant 

20 au moins une base de donnees* On rencontre de tels 
systemes notamment comme serveurs en ligne (on line) 
internes ou externes auxquels des utilisateurs se 
connectent pour consulter les bases de donnees 
correspondantes par 1' intermediaire de requetes et 

25 autres demandes de recherche de donnees. 



Les capacites « machine » du systeme d' inf ormation 
(unites centrales eventuellement mises en reseau) sont 
en general divisees en regions de traitement distinctes 

30 pilotees de fagon unitaire par une region de controle. A 
chaque region de traitement sont affectees un certain 
nombre de taches ordonnees (programmes ou sous- 
programmes a executer) et sont allouees les ressources 
materielles necessaires en memoires virtuelles et 

35 peripheriques (disques durs r imprimantes r memoires sur 
supports externes etc..) . Par souci d'efficacite en 
execution et en allocation de ressources materielles 
et/ou logicielles on affecte si possible a chaque region 




de traitement cies tach.es de meme type, telles que par 
exemple pour des tSches general ement executables dans la 
fendtre de maintenance dite fenetre « batch », des 
reorganisations de fichiers ou bases de donnees 
5 (demandant beaucoup d r espace de disque) ou des copies 
images de fichiers (demandant des peripheriques de 
sortie externe, lecteurs de bandes magn<§tiques, 
lecteurs/graveurs de CD-ROM, etc..) . 

10 TECHNIQUE ANTERIEDRE 

D'une fagon generale les reorganisations de bases de 
donnees sont necessaires pour eviter que les 
performances des transactions (lecture et/ou raise a 
15 jour) accedant aux bases de donnees ne se degradent. 
Toutefois il n r est pas possible de maintenir tous les 
objets d'un systeme d' information en etat de parfaite 
organisation parce que : 

i) les reorganisations consomment du temps et des 
20 ressources du systeme (processeurs, memoire vive et 

m§moires sur disques) ; 

ii) des reorganisations trop frequentes entraineraient 
des couts de realisations superieurs aux surcouts 
generes par 1' exploitation de bases de donnees 

25 faiblement desorganisees. 

Une premiere etape du travail de gestion de la 
reorganisation d'un ensemble de bases de donnees 
consiste en 1' elaboration d'un planning d' execution des 

30 reorganisations* Ce planning est utilise pour le 
lancement des reorganisations des bases de donnees hors 
ligne (off line) pendant la periode de maintenance 
journaliere de quelques heures prevue pour le systeme 
d' information (fenetre « batch » ou fenetre des 

35 executions groupees) . 




On connalt des outils logiciels susceptibles de generer 
le planning d' execution des reorganisations a venir en 
fonction : 

- de la liste des objets a reorganiser, 

5 - de la frequence predeterminee de reorganisation par 
ob j et , 

- du niveau de disorganisation des objets mesure par des 
techniques non documentees . 

10 Toutefois aucun des outils connus ne remet en cause le 
planning initial en fonction d'evenements pouvant 
survenir pendant 1' execution des reorganisations 
planifiees. 

15 Accessoirement aucun de ces outils ne pretend proceder a 
une etude d' optimisation pour generer ce planning, 
notamment a partir des ressources materielles et 
logicielles disponibles instantanement et/ou a partir 
des couts de reorganisation et/ou de non-reorganisation 

20 ou en fonction de paranietres instantan£s reels ou 
estimes des objets a reorganiser tels que leur taille, 
leur taux de disorganisation et leur temps de 
reorganisation . 

25 EXPOSE DE L' INVENTION 

1/ invention a pour but une gestion de la reorganisation 
d'un ensemble de bases de donnees indexees d'un systdme 
informatique d' information pexmettant d'ameliorer les 
30 performances d'une configuration donn6e du systeme 
d' information par une recherche d' optimisation 
continuelle, notamment du point de vue couts et/ou des 
temps de reorganisation des reorganisations des bases de 
donnees (et/ou leurs partitions) et de leurs index. 

35 

A cette fin, 1' invention propose une methode de gestion 
des reorganisations dans un ensemble de bases de donnees 
indexees d'un systeme informatique d' information adaptee 




a la reorganisation « hors ligne » dans au moins une 
region de traitement de reorganisation du systeme et 
comportant les phases operationnelles suivantes (voir 
figure 1) : 

5 (10) - Creation et maintien par mise a jour en continu 
d'une liste PRXOREORG des objets a reorganiser par 
priorite decroissante fonction de l'etat de 
disorganisation des objets & reorganiser ; 
(20) - Execution du processus IDPOR d' identification du 

10 premier ou prochain objet a reorganiser FOR avec, a 
chaque evenement Rft2R=l interne au systeme pour lequel 
la selection du premier ou prochain objet a reorganiser 
doit etre remise en cause , interruption et remise a z6ro 
et nouvelle execution du processus IDPOR, lequel 

15 processus comportant les etapes suivantes : 

(21) - Etablissement d'un planning rapide de 
reorganisation PRR a l'aide de la liste PRIOREORG et du 
temps operationnel residuel disponible TRR dans 
1' ensemble des regions de reorganisation et d'une liste 

20 de selection SEXaECT/OR d' objets a reorganiser OR 
ordonnes par priorites decroissantes optimisees en 
fonction du gain de la reorganisation de chaque objet 
OR, ledit gain etant defini comme le produit d r un 
facteur representatif du taux de disorganisation d'un 

25 objet OR par le temps de reorganisation de cet objet; 

(22) - Etablissement d'un retroplanning de 
reorganisation dans lequel pour tout objet courant a 
reorganiser OR extrait de la liste SELECT/OR par 
priorite croissante pour favoriser le traitement avance 

30 des objets de plus grandes tallies possibles, on calcule 
pour chaque region de reorganisation le dernier delai de 
la region DDRR, representant dans la fenetre « batch » 
allouee £ la reorganisation « hors ligne » le temps 
minimal necessaire a la reorganisation de 1' objet 

35 courant OR, egal dans le cas present a la duree de temps 
consomme DCRR plus le temps de reorganisation de 1' objet 
courant DROR; 




(23) - Identification de la region de traitement RTR 
de l'objet courant OR par adequation optimisee entre la 
duree de traitement disponible dans ladite region DRR 
avec la duree de traitement DROR necessaire pour la 

5 reorganisation de l'objet OR avec DRR - DDRR 
minimal <0 ; 

(24) - Inscription de l'objet courant OR comme 
prochain objet a reorganiser POR au planning de la 
region identifiee en valorisant le pointeur FOR 

10 correspondant a l'adresse de l'objet courant a 
reorganiser et en augmentant la duree de temps consoram<§ 
DCRR dans la region du temps de la reorganisation DROR* 
(30) - Lancement de la reorganisation de l'objet POR dds 
que la region de traitement de reorganisation RTR 
15 identifiee est liberie en 1' absence de tout ev^nement 
RAZR=1 survenu entre temps ; Remise a ziro et nouvelle 
execution du processus IDPOR. 

Ainsi 1' introduction dans la methode de gestion selon 
1' invention du principe meme du planning rapide de 
reorganisation PRR (dont le temps machine est minimal 
pour permettre des reactualisations frequentes sans 
veritable penalisation) et du principe de la 
reactualisation permanente du planning rapide de 
reorganisation PRR permet de prendre en compte 
immediatement 1' evolution du systeme d' information 
complet et des ses principaux paramitres (taux 
instantane de disorganisations des objets a reorganiser , 
allongement de la duree d'une reorganisation par rapport 
a la duree estimee, liberation d'une region de 
traitement , fin d'une t^che de reorganisation, etc ) 
pour modifier les priorit6s des reorganisations et 
optimiser le lancement de celles-ci. 

35 A cote des reorganisations de fichiers tels que bases de 
donnees les copies des fichiers modifies constitue un 
imp6ratif de securite dans le domaine de 1' exploitation 
de systemes inf ormatiques. En effet pour des raisons de 
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securite inf ormatique certains systemes d f information 
utilises pour la gestion d'un ensemble cie bases de 
donnees incorporent dans leur ensemble de logiciels 
d r exploitation un dispositif de verrouillage de la 
5 remise en service d' une base de donnees reorganisee 
avant la prise de la copie de sauvegarde correspondante. 

Selon un premier mode d' execution de la methode de 
gestion selon 1' invention l r ordre optimal des 

10 reorganisations est coordonne avec l'ordre des copies de 
sauvegarde d'objets du systdme d' inf ormation en tenant 
compte des reorganisations en cours ou juste effectuees. 
Selon une variante avantageuse l'ordre des copies de 
sauvegarde est modifie par 1' execution en premiere 

15 priorite, pour au moins un objet a reorganiser OR, de la 
copie dudit objet OR au plus tot en fin de traitement de 
reorganisation . 

Pour ce faire, la m<Sthode de gestion des reorganisations 
20 selon 1' invention est globalisee pour gerer d'une part 
les reorganisations , d' autre part les copies sachant que 
pour des raisons d' optimisation on a la faculty de 
decouper les objet s £ traiter en partitions jusqu'aux 
plus petites parties d'objets a traiter possibles pour 
25 chaque type de traitement • II en resulte que la liste et 
les objets a copier peuvent etre differents de la liste 
et des objets a reorganiser. 

Par ailleurs en ce qui concerne les copies, on distingue 
30 genera lement trois types de copie, la copie en continu 
ou copie « journal » (en anglais « log ») , la copie 
increment ale qui ne prend que les modifications 
apportees aux fichiers et la copie totale ou copie 
image. Dans le cadre de la presente invention, sont 
35 concernees principalement les copies images et 
accessoirement les copies incrementales. 




D'une fagon silimaire a ce qui a ete mis en place pour 
les reorganisations, la methode de gestion des 
reorganisations et des copies comporte une phase de 
creation et de maintien d'une liste PRIOCOPXE de 

5 prior ite des objets a copier (en fonction du temps passe 
depuis la derniere copie de chaque objet a copier OC) et 
1' etablissement d f un planning rapide de copie r sachant 
que certains objets OR juste reorganises (par exemple 
une base de donnees) sont deverrouill^s avant remise en 

10 ligne par une prise de copie image; pour ce faire, on 
choisit dans le cadre de la pr^sente invention de copier 
ces objets en premiere priorite „ II en resulte une 
double interaction entre le planning rapide de copie PPC 
et le planning rapide de reorganisation PRR* (voisin du 

15 planning PRR mais modifie en consequence pour integrer 
la composante copie) , pour le premier, PPC, par la 
priorite premiere donn6e & certaines ou & toutes les 
copies apres reorganisations et pour le second, PRR*, 
par 1' allongement du temps total de reorganisation par 

20 addition au temps machine reel de reorganisation d'un 
temps d'attente (aussi appele temps gaspille) 
correspondant au temps de copie de 1'objet juste 
reorganise • 

25 A cette fin, l f invention propose une methode globale de 
gestion des reorganisations d'un ensemble de bases de 
donnees indexees d'un systeme informatique d' information 
adaptee a la reorganisation « hors ligne » integrant la 
gestion des copies et comportant les phases 

30 operationnelles suivantes (voir figure 2) : 

(40) - Creation et maintien par mise £ jour en continu : 
- d'une liste PRI0REOR6 des objets a r^organiser par 
priorite decroissante fonction de l'etat de 
desorganisation des objets a r<§organiser ; et 

35 - d'une liste PRXOCOPXE des objets a copier par 

priorite decroissante fonction de 1'anciennete des 
dernieres copies des objets a copier. 




(50) - Surveillance en continu de 1' apparition dans le 
systeme d' information de tout evenement : 

- R&2R=1 pour lequel la selection du premier ou 
prochain objet a reorganiser FOR doit etre remise en 

5 cause, notamment une fin d'une tache de 

reorganisation dans une region de traitement de 
reorganisation et/ou la liberation d'une zone de 
traitement pour la reorganisation ou la copie ; et/ou 

- R&SC—l pour lequel la selection du premier ou 
10 prochain objet a copier FOC doit etre remise en 

cause, notamment une fin d'une tache de copie dans 
une region de traitement de copie, une copie 
prioritaire en fin de reorganisation et/ou la 
liberation d'une zone de traitement pour la 
15 reorganisation ou la copie, 

avec 

pour tout evenement R&ZR=1, lancement de 1 ' execution du 
processus IDFOR d' identification du premier objet a 
reorganiser FOR ou, si le processus IDFOR est en cours 
20 d r execution, interruption et nouveau lancement du 
processus IDFOR ; et/ou 

pour tout evenement R&2C=1, lancement de 1' execution du 
processus IDFOC d' identification du premier objet a 
copier FOC ou, si le processus IDFOC est en cours 
25 d' execution, interruption et nouveau lancement du 
processus IDFOC ; 

- le processus IDFOR comportant les operations suivantes 
(51) - Etablissement d'un planning rapide de 
reorganisation FRR* & l r aide de la liste FRI6REORG et du 

30 temps operationnel de reorganisation residuel disponible 
TRR dans 1' ensemble des regions de reorganisation et 
d'une liste de selection SELECT/OR d'objets a 
reorganiser OR ordonn^s par priori tes decroissantes 
optimisees en f onction du gain de la reorganisation de 

35 chaque objet OR, ledit gain etant defini comme le 
produit d'un facteur representatif du taux de 
desorganisation d'un objet OR par le temps de 
reorganisation de cet objet; 



(52) - Etablissement d'un planning rapide de copie 
PRC a partir de la liste SEIiECT/OR, puis de la liste 
PRIOCOPIE et dans la limite du temps operationnel de 
copie residuel disponible TRC dans 1' ensemble des 

5 regions de copie, d'une liste de selection SELECT/OC en 
memoire de type LIFO ou pile d'objets a copier OC 
empiles par priorites d^croissantes; 

(53) - Etablissement d'un retroplanning de copie dans 
lequel pour tout objet courant a reorganiser OR extrait 

10 de la liste SELECT/OR par priorite croissante, on 
calcule pour chaque region de copie le temps & reserver 
TCR pour la copie de 1' objet OR apres reorganisation ; 

(54) - Etablissement d'un retroplanning de 
reorganisation dans lequel pour tout objet courant a 

15 reorganiser OR extrait de la liste SELECT/OR par 
priority croissante pour favoriser le traitement avance 
des objets de plus grandes tallies possibles, on calcule 
pour chaque region de reorganisation le dernier delai de 
la region DDR, repr^sentant dans la fenetre « batch » 

20 allouee a la reorganisation « hors ligne » le delai 
minimal necessaire a la reorganisation de 1' objet 
courant OR, selon une formulation distincte si une copie 
de 1' objet OR en fin de reorganisation doit §tre faite 
ou non; 

25 (55) - Identification de la region de traitement RTR 

de 1' objet courant a reorganiser OR par adequation 
optimisee entre la duree de traitement disponible dans 
ladite region DRR avec la duree de traitement DROR 
necessaire pour la reorganisation de 1' objet courant OR 

30 avec DRR - DDI* minimal <0 sans copie a faire ou avec 
valeur absolve de DRR - DDL minimal et DROR+DCOR < DRR 
si copie a faire; 

(56) - Inscription de 1' objet courant a reorganiser 
OR comme prochain objet a reorganiser POR au planning de 

35 la region identifiee en valorisant le pointeur POR 
correspondant a l'adresse de 1' objet courant OR, en 
augmentant la duree de temps consomme SCRR dans la 
region du temps de la reorganisation DROR et recalculant 



# • 



la duree gaspillee dans la region de reorganisation DGRR 
du fait des copies d'objets OR en fin de reorganisation. 
(60)- Lancement, en 1' absence de tout evenement de 
remise a zero R&£R=1 survenu entre temps , des qu'une 
5 region de traitement de reorganisation RTR identifiee 
est disponible, de la reorganisation de 1' objet POR ; 
Remise a zero et nouvelle execution du processus XDPOR ; 
et, 

le processus IDFOC comportaint les operations suivantes 

10 (51) - Etablissement d'un planning rapide de 

reorganisation PRR* a l'aide de la liste PRIOREORG et du 
temps operationnel de reorganisation residuel disponible 
TRR et d'une liste de selection SELECT/OR d'objets a 
reorganiser OR ordonnes par prioritds decroissantes 

15 optimisees en fonction du gain de la reorganisation de 
chaque objet OR, ledit gain etant defini comme le 
produit d'un facteur repr<§sentatif du taux de 
disorganisation d'un objet OR par le temps de 
reorganisation de cet objet; 

20 (52) - Etablissement d'un planning rapide de copie 

PRC a partir de la liste SELECT/OR, puis de la liste 
PRXOCOPIE et dans la limite du temps operationnel de 
copie residuel disponible TRC, d'une liste de selection 
SELECT/OC en memoire de type LIFO ou pile d'objets OC 

25 empiles par priorites decroissantes; 

(53 r ) - Etablissement d'un retroplanning de copie 
avec determination des durees de copie disponibles en 
region copie, depilage de la liste SELECT/OC de haut en 
bas et recherche d'une region copie par adequation entre 

30 la duree copie disponible et la duree copie de 1' objet 
courant & copier OC de fa<?on & copier les objets les 
plus grands possibles et marquage de l'origine de 
reorganisation ou non de 1' objet a copier ; suivi de 
- 1' identification de la region de traitement RTC de 

35 1' objet a copier par adequation entre la duree de 
traitement disponible dans ladite region avec la duree 
de traitement n6cessaire pour la copie de 1' objet 
courant OC; suivie de 
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- 1' inscription de 1' objet courant OC comme le prochain 
objet a copier POC au planning de la region RTC 
identifiee en valorisant le pointeur POC correspondant a 
l'adresse de 1' objet OC et en diminuant la duree de 
5 traitement disponible du temps de la copie de 1' objet OC 
retenu comme POC ; 

(60')- Lancement, en 1' absence de tout evenement de 
remise a zero R&ZC=1 survenu entre temps , des qu'une 
region de traitement de copie TRC identifiee est 
10 disponible, de la copie de 1' objet POC; Remise a zero et 
nouvelle execution du processus IDPOC. 

Bien entendu sans sortir du cadre de 1' invention , il 
existe dans des variantes de la methode de 1' invention 
15 certains cas d' objets a reorganiser OR pour lesquels la 
copie juste apres reorganisation n'est pas necessaire. 
Dans ces cas et pour ces objets particuliers les phases 
operationnelles ci-dessus sont modifiees en consequence. 

20 En particulier dans une recherche continuelle 
d f optimisation, la methode gestion selon 1' invention 
dans une de ses variantes integre dans les phases 
finales de processus IDPOR d' un objet OR une phase de 
recherche d'un ou plusieurs objets a reorganiser OR sans 

25 copie OR dans la liste SELECT/ OR ou S defaut dans la 
liste PRXOREOR6 susceptibles d' etre reorganises dans la 
region de traitement RTR correspondant e pendant 
l r intervalle du temps d' attente de la copie de 1' objet 
OR apres reorganisation . 

30 

Avantageusement la phase (51) d' Etablissement d'un 
planning rapide de reorganisation PRR* comporte les 
operations suivantes (voir figure 3) : 

(511) - Initialisation : dans laquelle sont notamment 
35 annuies les indicateurs de selection des objets OR, 

initialise le compteur-limiteur de remises en causes, 
les temps residuels de copie TRC et de reorganisation 




TRR et la duree miniiaale B de reorganisation et copie 
d'un objet OR ; 

(512) - Boucle sur objets : dans laquelle notamment pour 
tout objet reel OR de la liste PRXOREORG pris dans 

5 l'ordre decroissant jusqu'a ce que TBR < E, une 

marque de * selection possible ' de 1' objet est posee; 

(513) - Elimination des intersections d' objets : dans 
laquelle notamment sont elimines de la * selection 
possible' les objets r£els OR parties d'espaces de 

10 tables §galement appeles objets globaux deja 

selectionn§s en tout ou partie; 

(514) - Remise en cause des choix precedents : dans 
laquelle notamment sont elimines de la * selection 
possible' les objets OR dont le temps total de 

15 reorganisation et copie est superieur au temps de 

reorganisation residuel TTR et a defaut dans laquelle 
1' objet courant OR et les objets OR deja selectionnes 
dans la liste SEiLECT/OR sont soumis & un processus 
d' optimisation en fonction du gain de reorganisation 

20 avec replacement d'un objet deja selectionne par 

1' objet en cours avec essais, dans la limite du terme 
du compteur-limiteur, de combinaisons successives 
tendant a retenir pour etre selectionne au final dans 
SKLECT/OR des objets de plus grand gain de 

25 reorganisation possible et a les associer aux autres 

objets OR de la ^selection possible' de fa<?on £ ce 
que le temps total des reorganisations de tous les 
objets OR retenus soit inferieur mais le plus proche 
possible du temps residuel de reorganisation ERR. 

30 (515) - Verification de la suffisance du temps copie 
disponible dans le temps residuel de copie TRC pour 
chaque objet OR en passe d'etre finalement 
selectionne pour la reorganisation compte tenu de la 
priorite de reorganisation de 1' objet OR par rapport 

35 aux objets £ copier en prealable du fait de leurs 

priorites copie superieures . 
(516) - Selection de 1' objet courant dans la liste 
SEISCT/OR : dans laquelle notamment sont positionnes 




les indicateurs de l'objet courant et de l'objet 
global associe, annul§s eventuellement les 
indicateurs du ou des objets OR deselect ionnes et 
diminuer TBR et TRC des temps respectifs de 
5 reorganisation et de copie. 

Encore avantageusement, ladite phase (52) 

d'etablissement d'un planning rapide de copie PRC 
comporte les operations suivantes (voir figure 4) : 

10 (521) - Initialisation : au sortir d'un planning de 
reorganisation PKR* et dans laquelle sont notamment 
videes les piles de selection de copie PSC1 et PSC2, 
initialises le compteur-limiteur de remises en causes, 
le temps residuel de copie TRC et la duree minimale EC 

15 de copie d'un objet & copier OC ; 

(522) - Inspection des regions de reorganisation : Pour 
toutes les regions , 

si region active, et si image copie de I 7 objet en cours 
de reorganisation a faire et/ou si image copie de tout 

20 objet OR de la liste SELECT/ OR pris dans l'ordre des 
priorites decroissantes a faire: pour tout sous-objet 
susceptible d' etre copie separement, notamment une 
partition, sous traction du temps de copie du sous-objet 
de TRC et placement du sous-objet en haut de la premiere 

25 pile PSC1 ; 

(523) - trait ement de la liste des objets a copier 
PRXOCOPIE : dans laquelle notamment pour tout objet a 
copier OC de la liste PRXOCOPIE pris dans l'ordre 
decroissant jusqu'a ce que TRC < EC et absent de PSCl, 

30 soustraction du temps de copie du sous-objet OC de TRC 
et placement du sous-objet OC en haut de la seconde pile 
PSC2 , 

(524) - Empilage des piles de selection : dans laquelle 
la pile PSCl est superposee a la pile PSC2 pour 

35 constituer la liste SELECT/PC . 



: 
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Encore 



avantageusement , 



ladite 



phase 



(53) 



d' etabl is semen t d'un retroplanning de copie dans le 
processus XDPOR comporte les operations suivantes : 

(531) Initialisation des regions de copie : dans 
5 laquelle au sortir d'un planning de reorganisation pour 

toutes les regions de copie , la duree consommee de la 
region DCRC est mise a zero, 

(532) Determination du temps de copie a reserver SCR : 
dans laquelle pour tout objet reel de la liste SELECT/OR 

10 parcourue dans 1'ordre des priorites croissantes et pris 
comme objet a reorganiser courant OR, 

-le temps a reserver pour copier TCR 1' objet reel 
courant OR est mis a zero ; 

-Si 1' image copie de tout objet OR de la liste SELECT/OR 
15 pris dans 1'ordre des priorites croissantes doit etre 
faite: pour tout sous-objet susceptible d'etre copi6 
s6par6ment, notamment partition, on recherche une region 
copie dont la dur§e consommee DCRC est minimale, on 
ajoute le temps de copie du sous-objet a la duree 
20 consommee de la region courante DCRC et on valorise le 
temps & reserver TCR pour copie de 1' objet courant = 
x&axiraizm (du temps & reserver TCR pour copie de l f objet 
courant. et de la duree consommee dans la region DCRC) . 

25 Encore avantageusement, la phase de retroplanning de 
reorganisation (54) dans le processus IDPOR comporte les 
operations suivantes : 

(541) - Initialisation : dans laquelle pour toute region 
de reorganisation, 

30 - Duree de la region DRR = Duree de la fenetre * batch' 
DFB moins l'heure relative estimee de fin du traitement 
de reorganisation en cours dans la region HRFR 

- Duree consommee dans la region DCRR = 0 

- Duree gaspillee dans la region DCSRR = 0 

35 - Pointeur premier objet a reorganiser de la region 
courante = 0 

(542) - Determination du dernier delai de la region de 
reorganisation DDRR : dans laquelle pour tout objet reel 
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OR selections de la liste SSLECT/OR dans l'ordre des 
priorities croissantes : 

Pour chaque region si 1' image copie de 1'objet courant 
OR a faire, calcul du dernier delai de la region DDRR = 
5 duree de reorganisation de 1'objet courant DROR + max 
[temps a reserver pour copie de 1'objet courant TCR, 
* (duree consommee de la region DCRR + duree gaspillee de 
la region DGRR) ] ; 

- Sinon, calcul du dernier delai de la region DDR = 
10 duree consommee de la region DCRR + max [ (duree de 

reorganisation de 1'objet courant DROR, duree gaspillee 
de la region DGRR) ] ♦ 

Encore avantageusement la phase d' identification de la 
15 region de reorganisation RTR (55) comporte les 
operations suivantes : Selon le type d'objet courant a 
reorganiser OR 

(551) - Recherche de la region de traitement de 
reorganisation susceptible d'accueillir de fagon 

20 optimale un objet a reorganiser OR sans copie : 
comport ant 

- la recherche d'une region dont le dernier delai DDRR 
est minimal, et si dernier delai de la region courante 
DDR est superieur a la duree de la region courante DRR, 

25 la recherche d'une region pour laquelle : [duree de la 
region courante DRR moins le dernier delai de la region 
courante DDRR] est mininale et positive ou mille ; sinon 

(552) - Recherche de la region de reorganisation 
susceptible d'accueillir de fagon optimale un objet a 

30 reorganiser OR avec copie : comportant 

- la recherche d'une region telle que : [duree de la 
region DRR moins dernier delai de la region courante 
DDRR] est xainimale en valeuar absolue, et [duree de 
reorganisation DROR + temps de copie objet courant TCR] 

35 < duree de la region DRR. 



Encore avantageusement la phase d' inscription de 1'objet 
OR au planning de la region de reorganisation RTR (56) 
coraporte les operations suivantes : 

(561) - Inscription de 1'objet courant OR comme prochain 
objet a reorganiser POR: dans laquelle si image copie de 
1'objet courant OR a faire ou duree gaspillee de la 
region courante = 0, on valorise le pointeur premies* 
objet a reorganiser POR de Xa, region coiarante = adresse 
de 1' objet courant, 

(562) - mise a jour DCRR et DGRR : dans laquelle on 
ajoute la duree de reorganisation de 1'objet courant 
DROC a la duree consommee de la region courante DCRR, et 
on valorise la duree gaspillee de la region courante 
DGRR = dernier delai de la region courante DDRR t- duree 
consommee de la region courante DCRR. 

Toujours avantageusement la phase (53') d' etablissement 
d'un retroplanning de copie dans le processus IDPOC 
comporte les operations suivantes: 

(531') Initialisation des regions de copie : dans 
laquelle pour toutes les regions , 

-la duree de region DRCOP est valorisee a la durde 
fenetre « batch » DFB moins 1'heure relative estimee de 
fin de traitement copie en cours HRFC, 

-la duree consommee de la region DCRCOP est mise a zero, 
le pointeur du premier objet a copier POC de la region 
courante est mis & zero 

(532') Depilage et identification du prochain objet a 
copier POC : Dans la laquelle, 

-Pour tout objet de la pile PSC1/PSC2 parcourue de haut 
en bas un objet courant a copier OC est extrait lorsque 
le temps de copie de 1'objet courant TCOC < DRCOP la 
plus longue ; 

-On cherche pour identifier- JLa region de traitement 
copie une region dont la duree consommee DCRC est 
minimale ; dans 1' affirmative si le temps de copie de 
1'objet courant TCOC > DRCOP - DCRCOP on cherche une 
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region pour laguelle DRCOP - DCRCOP - TCOC minimale, 
positive ou nulle, 

Si aucune region ne convient, on choisit une region a 
copier pour laquelle DRCOP - DCRCOP - TCOC est negative 
5 et minimale en valeur absolue et pour laquelle TCOC < 
DRCOP ; 

-Si 1' objet courant appartient a la seconde pile PSC2, 
soit un objet a copier non issu d' une reorganisation, le 
pointeur de 1' objet POC pour la region courante choisie 
10 est valorise a l'adresse de l r objet courant OC de fagon 
a inscrire 1' objet POC au planning de la region de 
traitement copie RTC identifi^e ; et 

-Pour terminer , on ajoute la duree copie TCOC a la duree 
consommee de la region courante DCRCOP. 



Selon les diverses variantes de mise en oeuvre de la 
methodes de gestion de reorganisations « hors ligne » 
dans des regions de traitement il est possible de 
choisir les 6vdnements internes au systerae remettant en 
20 cause la selection des objets POR ou POC les plus 
appropries aux processus de selection utilises. 

En particulier les ev^nements internes au systeme R&3R—1 
e*t RARC=1 entrainant la remise en cause de la selection 

25 des objets POR ou POC sont notamment constitu^s 
respectivement par la fin d'une tache de reorganisation 
dans une region de traitement de reorganisation pour les 
objets POR ou par la fin d'une tciche de copie dans une 
region de traitement de copie pour les objets POC, une 

30 copie prioritaire en fin de reorganisation et/ou la 
liberation d' une zone de traitement pour les objets FOR 
et POC. 

Parallelement ou non a la mise en ceuvre la methode 
35 adaptee aux reorganisations « hors ligne », 1' invention 
propose une methode de gestion des reorganisations dans 
un ensemble de bases de donnees indexees d'un systeme 
d' information adaptee a la reorganisation « en ligne » 
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et caracterisee en ce qu'elle comporte au moins les 
phases opirationnelles suivantes: 

- une phase d' analyse instantanee d'au moins un objet a 
reorganiser OR parmi les objets susceptibles de 

5 reorganisation, notamment bases de donnees, partitions 
et/ou index, et d' estimation du surcofit associe au 
niveau de disorganisation de 1' objet a reorganiser OR; 

- une phase d' estimation instantanee du cout de la 
reorganisation en ligne en fonction de la taille dudit 

10 objet a reorganiser OR et du taux de disorganisation 
dudit objet OR; et 

- une phase de determination du seuil Ds de 
disorganisation minimal de 1' objet a reorganiser OR au 
dessus duquel seuil la reorganisation « en ligne » peut 

15 etre lancee pour cet objet OR et le, cas echeant, du 
lancement effect if de cette reorganisation en ligne, le 
seuil Ds correspondant sensiblement au minimum du cout 
total du surcout estime de la disorganisation de 1' objet 
OR et du coGt estimi de la riorganisation pour 1' objet 

20 OR considere. 



Selon une premiere variant e, la mithode de gestion des 
reorganisations « on line » est caracterisie en ce que 
le lancement de la riorganisation « en ligne » est 

25 retarde pour attendre une fenetre temporelle d'activiti 
reduite de la base de donnies concernee. Selon une 
variante particuliere de 1' invention la mithode de 
gestion incorpore une phase de calcul de l'heure 
optimale de lancement d' une riorganisation «en ligne» 

30 (on line) en fonction de l'activite reelle ou privue du 
systime d' information correspondant. 

D'une fagon plus globale les methodes des 
riorganisations « en ligne » et « hors ligne » sont 
35 combinies de fagon ^ ce que pour un objet OR silectionni 
comme prochain objet £ reorganiser POR la prioriti est 
donnee pour la riorganisation « hors ligne », 
1' intervention de la riorganisation « en ligne » n'itant 
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requise qu'apres depassement du seuil Ds. II est ainsi 
possible de soulager la reorganisation « hors ligne » 
par des reorganisations « en ligne » lorsque ces 
dernieres ne sont pas trop penalisantes au niveau de la 
5 qualite des services en ligne. 

L" invention concerne egalement une methode de gestion 
des reorganisations « en ligne » et « hors ligne » dans 
un ensemble de base de donnees indexees caracterisee en 
ce que pour un meme objet POR la priorite est donnee 
pour la reorganisation « hors ligne », 1' intervention de 
la reorganisation « en ligne » n'etant requise qu'apres 
depassement du seuil Ds pour 1' objet POR considere. 



Selon une premiere version de la methode de gestion des 
reorganisations « on line » utilisee pour la 
reorganisation des bases de donnees indexees de type 
espace de tables, la methode est caracterisee en ce que 
pour un objet a reorganiser OR, le seuil Ds est defini 
par une approximation donnee par la formule PS' 
suivante : 

R = Ds 2 r Co* / 2 . 1 -c = 1 

lorsque que XT, moyenne horaire du nombre de mises a jour 
sur 1' objet OR, est faible, et dans laquelle : 
25 r designe le nombre moyen de lignes ou cle-RID par page 
de 1' objet entier, 

I designe le nombre d' insertions de lignes (ou de cle- 
RID pour les index) a l'heure dans 1' objet OR, 
Co* designe le surcout horaire lorsque 1' objet est 
30 totalement desorganise 

c designe un parametre machine, le rapport du temps 
d'acces S/S par la taille de 1' objet Hbp. 

Selon une variante de la methode de gestion des 
35 reorganisations « on line » precedente et utilisee pour 
la reorganisation des index, le seuil Dsl est defini 
pour -on index par une approximation donnee par la 
formule F7' suivante : 




SL= DsZ 2 r <fc*+l)3gfep.^ / [2(V+3)] = 1 

lorsque que U, moyenne horaire du norabre de mises a jour 
sur 1' index, est faible, et dans laquelle : 
Ts designe le temps de deplacement de bras, Tl le temps 
5 de latence (1/2 tour du bras) . 

c = {T&+ 3.T1)/Mbp ou Ts en E/S designe le temps de 
deplacement du bras du disque, et Tl le temps de latence 
(1/2 tour du bras) et ?= Ts/Tl. 

designe le taux de relecture de l'objet, c'est a dire 
10 le nombre moyen de fois qu'une entree sera relue* 

Selon une autre variante de la methode de gestion des 
reorganisations « en ligne » prec<§dente et utilisee pour 
la reorganisation des bases de donnees indexees de type 

15 espace de tables monotable a n index, caracterise en ce 
que le seuil DsT est defini pour ian espace monotable par 
une approximation donn<§e par la formule FX3' suivante : 
R = r.HbpCDsT 2 .^ (V+l) * V.E(DsT 2 -b± 2 ) (t*i+l) / (2V+S) m 1 
lorsque que U, moyenne horaire du nombre de mises a jour 

20 sur l r espace monotable, est faible, et dans laquelle : 

li designe la proportion de lignes accedees par parcours 
sequent iel sur le nombre de lignes creees, 
£ represent e le signe mathematique Sigma (somme des 
expressions f(xi) pour i index allant de 1 a n) , 

25 bi representent les valeurs instantanies de D (taux de 
disorganisation de 1' espace monotable) lors des 
dernieres reorganisations des n index, et 
fc*± representent les taux d'acces directs au travers de 
chaque index ±. 

30 

L' invention concerne <§galement 1' application de la 
methode de gestion des reorganisations dans un ensemble 
de bases de donnees indexees d'un systeme informatique 
d' information presentee ci-dessus dans toutes ses 
35 variantes. a la reorganisation des bases de donnees 
indexees de type espace de tables defini dans la 
description ci-apres. 




L' invention concerne egalement les syst£mes 
informatiques de type systexaes cT information comportant 
un ensemble de bases de donnees indexees et les moyens 
adaptes pour la mise en oeuvre de la methode de gestion 
5 des reorganisations presentee ci-avant, de base de 
donnees indexees, notamment de bases de donn<§es de type 
espace de tables et/ou d' index* 

D'autres caracteristiques et avantages de la methode de 
10 gestion globale des reorganisations de bases de donnees 
indexees et de ses applications k la reorganisation des 
bases de donnees indexees notamment du type espace de 
tables selon la pr«§sente invention apparaitront a la 
lecture de la description qui va suivre en reference aux 
15 dessins ci- joints d'un mode de mise en oeuvre 
pr^ferentiel de 1' invention et present^ a titre 
d'exemple non limitatif. 



PRESENTATION SOMMAIRE DES DESSINS 
20 - la figure 1 represente un organigramme correspondant 
& la methode de gestion des reorganisations d'un 
ensemble de bases de donnees indexees, notamment de 
type espace de tables, selon 1' invention; 
la figure 2 represente un organigramme correspondant 
25 a la methode de gestion des reorganisations et des 

copies d'un ensemble de bases de donnees indexees, 
notamment de type espace de tables, selon 
1' invention; 

- la figure 3 represente un organigramme d^taillant les 
30 operations de la phase d' etablissement d'un planning 

rapide de reorganisation de la methode de la figure 
2 ; 

- la figure 4 represente un organigramme detaillant les 
operations de la phase d' etablissement d'un planning 

35 rapide de copie de la methode de la figure 2 ; 

la figure 5A represente un organigramme correspondant 
a une methode de lecture d'une base de donnees 
indexee, notamment en vue de la reorganisation de la 




base de donnees, utilisable dans le cadre de 
1' invention; 

la figure 5B represent e un organigramme correspondant 
a une methode de lecture de 1 ' index de la base de 
donnees indexee, notainment en vue de la 
reorganisation de 1' index, utilisable dans le cadre 
de 1' invention; 

la figure 6A represente un organigramme correspondant 
a une variante partielle de la methode de la figure 
5A appliqu<§e a la lecture et au dechargement de 
1 / index d'une base de donnees indexee de type espace 
de tables , notainment en vue de la reorganisation de 
la base de donnees indexee, utilisable dans le cadre 
de 1' invention; 

la figure 6B represente un organigramme correspondant 
3. une variante partielle de la methode de la figure 
5B appliquee a la lecture et au dechargement de 
1' index d'une base de donnees indexee de type espace 
de tables, notamment en vue de la reorganisation de 
1' index de la base de donnees indexee, utilisable 
dans le cadre de 1' invention; 

la figure 7 represente un organigramme correspondant 
a une variante partielle de la methode appliquee a la 
lecture et au dechargement de la base de donnees 
indexee de type espace de tables objet de la figure 
6A, utilisable dans le cadre de 1' invention; 
la figure 8A represente un organigramme correspondant 
une methode de reorganisation d'une base de donnees 
indexee de type espace de tables utilisant les 
methodes de lecture et de dechargement objet des 
figures 6A et 7, utilisable dans le cadre de 
1 ' invention ; et 

la figure 8B represente un organigramme correspondant 
une methode de reorganisation de 1' index de la base 
de donnees indexee de type espace de tables objet de 
la figure 8A, methode utilisant la methode de 
lecture et de dechargement objet de la figure 6B, 
utilisable dans le cadre de 1' invention. 



MEILLEUR MODE DE MISE EN OEDVRE DE 1/ INVENTION 

La description de la methode de gestion globale de 
5 reorganisation d'un ensemble de bases de donnees 
indexees qui va suivre, presentee a titre d'exemple non 
limitatif , se rapporte a une application particuliere de 
1' invention aux bases de donnees index6es structurees en 
espaces de tables ( ^tablespace' en anglais), 
10 susceptibles d'atteindre de tres grandes tailles 
(jusqu'a quelques milliards de lignes) et pour 
lesquelles le maintien d'une bonne organisation, 
notamment par une reorganisation rapide et efficace, est 
capital du point de vue performances. 

15 

Example de bases de donnees indexees, leg bases de 
donnees de type espace de table : 

Une base de donnee indexee structuree en espace de 
20 tables est compos^e d' un ou plusieurs f ichiers formes de 
blocs de taille unique ou pages numerotees en sequence £l 
partir de zero. Du point de vue logique on considere 
qu'il n'existe qu'un seul fichier compose de la 
succession de chacun des fichiers physiques numerotes 1, 
25 2, etc - . • . 

Parmi ces pages on trouve les pages de controle et les 
pages de donnees adaptees pour contenir des lignes, 
chaque ligne 6tant identifiee de fa<?on unique par son 
30 RID compose du numero de page et du numero d'ordre a 
l'interieur de la page. Chaque ligne est composee de 
champs de donnees appelees colonnes. Une cle est une 
liste de colonnes ayant un ordre croissant ou 
decroissant. A chaque cle est associee un index. 

35 

Un espace de tables peut contenir une ou plusieurs 
tables presentant chacune des colonnes specif iques. 
Toutefois les espaces de tables multi-tables peuvent 




etre traites comme les espaces de tables mono-table a 
condition de traiter les tables et leurs index en 
sequence . 

5 Les espace de tables peuvent etre partitionnes (divises 
en plusieurs parties ou partitions) . Chaque partition 
etant alors identique au fichier physique portant son 
numero - 

10 A la creation de la base de donnees, il est prevu un 
espace libre de donnees et un espace libre d' index 
constitues chacun de pages vides reparties dans 1' espace 
de tables et dans 1' index; le but de cette repartition 
de pages vides entre certaines pages de donn6es et index 

15 est de permettre des a j outs et autres mises £ j our de 
lignes de donnees ou de cles d' index a proximite des 
pages correspondantes et de limiter ainsi les 
disorganisations trop importantes . 

On considere qu'un espace de tables est bien organise 
20 lorsque : 

- 1' espace libre de donnees (pages vides) est distribue 
dans 1' espace de tables selon les parametres d'origine ; 

- les lignes sont rangees par ordre de RID dans le meme 
ordre que la premiere cle dite cle *primaire' . 

25 

1/ index est compose comme 1' espace de tables d' un ou 
plusieurs fichiers formes de pages. Les pages sont de 
plusieurs type, en particulier pages de controle, pages 
*feuilles' et pages de niveau superieur* Les pages 
30 feuilles contiennent des cles et pour chaque cle le ou 
les RID de la ou des lignes d' espace de tables dont la 
cl6 correspondante a la meme valeur, Ainsi a chaque 
ligne d f espace de tables est associe un couple cle-RID 
de page feuille de 1' index* 

35 

Chaque page feuille contient un ensemble contigu de 
couples cle-RID, c'est a dire qu'il n'existe aucun 
couple exterieur & la page qui soit . compris entre deux 




couples de la page* Les pages feuilles sont ainsi 
logiquement ordonndes par l'un quelconque de leurs 
elements . 

5 En cas de partitions d' espace de tables, il en sera de 
meme pour son index primaire, une partition d' index 
etant associ^e a chaque partition de 1' espace de tables. 

On considere qu'un index est bien organise lorsque: 
10 - l'espace libre est distribue dans 1' espace de tables 
selon les pararnetres d'origine ; 

- les pages feuilles sont rangees par numeros dans le 
meme ordre que les cles. 

15 La definition de base de donnees indexee de type x espace 
de tables' donn^e ci-dessus restera valable pour la 
suite de 1 ' expose . 

D'une fagon generale la reorganisation unitaire d f une 
20 base de donnees (et de son index) cons is te a decharger 
la base de donnees, a ranger ses lignes d' information 
dans un ordre souhaite, par exemple 1' ordre 
alphabetique, puis a recharger les lignes une fois 
rangees dans la base de donnees en mettant a jour les 
25 index, si possible de fagon reorganisee. 

Eggmglg de reorganisation « hors— ligne » de bases de 
donates indexees , notamment de fcsrpe espace de tables : 

30 Tou jours & titre d' exemple non limitatif, on utilise 
pour la reorganisation unitaire des bases de donnees 
indexees structuree en lignes et notamment les bases de 
type espace de tables un mode de lecture (dechargement) 
et un mode de reorganisation permettant de reduire 

35 sensiblement le temps necessaire a la lecture ordonnee 
de la base de donnees indexee (lecture et eventuelle 
mise en ordre continue ou discontinue) et/ou a la 
reorganisation de la base de donnees index<Se. 
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En particulier on utilise de fagon generale comme 
methode de lecture de bases de donnees indexee dans 
laquelle les donnees apparaissent sous forme de lignes 
5 de donnees , la methode IcSSC/BD/KEORG/BD : comportant les 
operations suivantes (voir figure 5A) : 

[101] - Lecture simultanee et sequentielle de 1' index et 
de lignes de la base de donnees, BDD, avec le chargement 
des index dans une premiere nuimoire tampon MX et le 
10 chargement des lignes dans une seconde memoire tampon 
MT, 

[102] - Lecture des index de la memoire tampon MX vers 
memoire tampon MT de fagon ordonnee, 

[103] - Recherche dans la memoire MT de la presence 
15 d'une ligne dont 1' identif iant est donne par la lecture 
ordonnee de 1' index , 

[103&] - Dans 1' affirmative , extraction de la ligne vers 
un fichier de lignes ordonn^es logiquement FT1, 
[103B] - Dans la negative , vidange partielle de la 
20 memoire tampon vers un fichier FT2 de lignes a trier 
avec elimination de la memoire tampon MT d'au moins la 
page dont le numero est le plus faible, 

[104] ~ Poursuite de la lecture jusqu'a la fin de la 
base de donnees, les lignes restantes n'ayant pu etre 
25 extraites de fagon ordonnee etant dirigees vers le 
fichier FT2. 

Appliquee a la reorganisation de la base de donnees , la 
methode de lecture LEC/BD/RSORG/BD permet, apres le tri 
30 du fichier FT2 pour donner FT'2 f de combiner les deux 
fichiers ordonnes FTl et FT f 2 en un fichier virtuel F2TV 
servant d' entree a la phase de rechargement de la 
reorganisation de la base de donnees. 

35 II est a noter que par fichier virtuel on entend un 
fichier qui n'a pas d' existence reelle, car ce fichier 
est le produit theorique de la fusion virtuelle de deux 
de fichiers , mais qui peut §tre utilise au rechargement 



comme un fichier r£el dans la mesure ou le programme de 
rechargement lit a la fois sur le fichier WTl et a la 
sortie 2 du tri (elle-meme un fichier virtuel 

generalement norame « exit de tri ») et opere la fusion 

5 ligne a ligne au lieu de lire un seul fichier. 
1/ expression fichier virtuel designe plus generalement 
une entity sur laquelle on peut operer les memes 
fonctions que sur un fichier sequentiel classique 
(ouverture, lecture ou ecriture d'un enregistrement , 

10 fermeture) et qui du point de vue de ces fonctions se 
comporte exactement comme un fichier sequentiel 
classique • 

Ainsi grace £ la generation en continu et par simple 
15 extraction, d'un fichier intermediaire de lignes 
ordonnees logiquement FT1 pendant 1' operation de lecture 
sequent ielle / le nombre de lignes a trier pr^sentes en 
en fin de parcours dans le fichier WT2 est reduit de 
fa?on substantielle d'ou un gain de temps sensible tant 
20 pour 1' operation de lecture de la base de donnees que 
pour le traitement complet de la reorganisation de la 
base de donnees. 



La methode de lecture de bases de donnees 
25 XiEC/BD/KEORG/BD perntet a partir d'une lecture de type 
sequentielle de la base de donnees d'obtenir un fichier 
virtuel ordonne des lignes de donnees tout en minimisant 
l'etape de tri effectuee sur un fichier intermediaire 
partiel. 

30 

De fagon analogue on utilise comme methode de lecture 
d' index de bases de donnees indexee dans laquelle les 
donnees apparaissent sous forme de lignes de donnees , la 
methode IiEC/XND/REORG/IND comportant les operations 
35 suivantes (voir figure 5B) : 

[1013C3 - Lecture sequentielle de 1' index avec le 
chargement des index dans une memoir e tampon MK r 




[102X] - Verification de la position du couple cle/ligne 
de plus bas numero d'ordre (cle/ligne IHF) present dans 
memoire tampon MK par rapport a la position du dernier 
couple traite, en particulier si le numero d'ordre du 
5 couple cle/ligne 3^F est superieur au numero d'ordre du 
dernier couple traite 

- Dans 1' af f irmative f extraction du couple 
cle/ligne vers un fichier de couples d r index 

logiquement ordonnes BZl r 

10 E103J2B] - Dans la negative, vidange partielle de la 
memoire tampon vers un fichier FX2 de couples a trier 
avec elimination de la memoire tampon BST d'au moins le 
couple cle/ligne dont le numero est le plus faible, 
[104XJ - Poursuite de la lecture jusqu'a la fin de la 

15 base de donnees, les couples cle/ligne restant n' ayant 
pu dtre extraits de fagon ordonn^e etant diriges vers le 
fichier WK2 . 

Ainsi 1' operation de lecture ordonnee de 1' index, 
20 continue ou discontinue en 1' absence de certaines 
valeurs de cle d' index, permet l r extraction directe d'un 
fichier d' index logiquement ordonne FXl et d' un fichier 
d f index a trier Aprds le tri du fichier FS2 pour 

donner 1FK' 2, les deux fichiers ordonnes F20. et FX' 2 sont 
25 fusionnes en un fichier virtuel servant d' entree a 

la phase de rechargement de la reorganisation de 
1 ' index . 

Dans la pratique on arrive a constituer des fichiers FTl 
30 contenant plus de 90% des lignes lues, D' autre part la 
dur£e d f un tri est plus que proportionnelle a la 
quantite d' information en entree, elle se trouve divisee 
par au moins 10. En ce qui concerne le temps de lecture, 
celui-ci reste bref car 1' operation de lecture est 
35 realisee de fagon sequentielle et simultanee sur la base 
de donnees et sur 1 9 index . 




Selon un premier mode de mise en oeuvre de la methode de 
lecture LEC/BD/KEORG/BD et applicable a une base de 
donnees indexee de type 'espace de tables', le processus 
de lecture et de dechargement de 1' index a l'aide la 
5 memoire tampon MS est realise par la methode 
LEC/IWD /REORG / TABLE comportant les operations 

suivantes {voir: figure 6A) : 

[201] - Autant de fois que necessaire jusqu'a avoir 
atteint la fin de 1' index et vide la memoire tampon MX, 

10 lecture sequentielle des pages de 1' index en ne 
conservant que les pages d' index contenant au moins une 
cle, jusqu'a remplir la memoire tampon ou atteindre la 
fin de 1' index ; cette lecture se faisant dans les 
emplacements non utilises de la memoire tampon ou 

15 contenant une page marquee invalide; 

[202] - Recherche et remplacement des pages invalides 
dans la memoire tampon de 1' index a partir de la 
premiere page de la memoire tampon MS, 

[206A] - Verification dans chaque page courante de la 

20 memoire tampon : 

- de 1' absence d'au moins un couple cle-RID superieur au 
dernier couple cle-RID traite en sequence logique (ecrit 
dans le fichier index trie FX1 ou envoye en lecture 
d'espace de tables/base de donnees); ou 

25 - de 1' exactitude de 1' expression PXC < PXL - DMA ou PXC 
represente le numero dans 1' index de la page courante de 
la memoire tampon MS, PSL le numero dans 1' index de la 
derniere page d' index lue et DMA. la difference maximale 
autorisee entre pages d' index en cours de lecture; 

30 [20SB] - Dans 1' affirmative d'au moins une des deux 
propositions, invalidation de la page courante PXC et 
retour a 1' operation [201] pour lecture d'une nouvelle 
page index en sequence; 

[203] - Recherche de la page valide PXmin de la memoire 
35 tampon MS qui contient la cle la plus basse CLE INF de 
toute la memoire ou en cas d'egalite de cle, le RID 
correspondant le plus bas; 
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[2043 ~ Traitement de la page BSfcain en sequence logique 
comportant les operations suivantes : 

[208A1 - Le cas echeant, lecture par ordre croissant de 
chacun des couples cle-RID de cette page PSxain; 
5 [208B] - Envoi de chacun des RID de cette page PSftain 
dans 1' ordre croissant des couples cle-RID vers le 
traitement de lecture de la base de donnees de type 
espace de tables; 

[204C] - Invalidation de la page PUmin traitee et retour 
10 a 1' operation [201] pour lecture d'une nouvelle page 
index en sequence* 

On notera que 1' operation 208B constitue un dechargement 
simplifie d' index, dans lequel seuls les RID des pages 
15 extraites en sequences logiques sont transmis et 
utilises pour la reorganisation de 1' espace de tables. 

En particulier la methode de lecture et de dechargement 
XsSSC/T^BUS/REORG/TSBI^E de 1' espace de tables a l'aide la 
20 memoire tampon MT est r<§alisee par les operations 
suivantes (voir figure 7) : 

£301] - Autant de fois que necessaire jusqu'a avoir 
atteint la fin de 1' espace de tables et vide la memoire 
tampon MT, lecture s<£quentielle des pages de 1' espace de 
25 tables ou de la partition & partir du debut en ne 
conservant que les pages de donnees contenant au moins 
une ligne, jusqu'a remplir la memoire tampon MT ou 
atteindre la fin de 1' espace de tables; 

[302] - Pour chaque RID present provenant de la lecture 

30 de 1' index (voir operation 208B) : 

- si le RID designe un num6ro de page PTRID infer ieur au 
minimum PTsain des numeros de pages dans la memoire 
tampon Jtt, le RID est ignore parce que la page deja ete 
traitee; retour au debut de 1' operation [302]; 

35 - si le RID designe un num<§ro de page PTRID superieur au 
maximum des numeros de pages PTjaas: dans la memoire MT, 
la page n'a pas encore ete lue et on effectue [303]; si 
noh on effectue [304] ; 
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- si le RID est absent on effectue [305] ; 
[303] - Si PTRID — Plizaax < INC, ou 1' increment autorise 
INC represente le noinbre maximal de pages de l'espace de 
tables qui peuvent §tre lues pour retrouver un RID 
5 donne, on effectue [303A] autant de fois que necessaire 
jusqu'a obtenir la page portant le numero de RID ; a 
defaut on effectue [303B]; 

[303A]- Vidange du contenu de la page de la memoire MT 
ayant le plus petit numero de page PSoin en envoyant les 

10 lignes correspondantes dans le fichier tri-espace de 
tables FT2; lecture a 1' emplacement de Pmxn, de la page 
suivante k la page PTmax de la memoire tampon MT et on 
recommence jusqu'a obtenir une page de donnees contenant 
au moins une ligne; lorsque la dernidre page introduite 

15 dans la memoire MT porte bien le numero de RID, on 
effectue l'op§ration [304]; 
[303B]- Si PTRID - PTmax > INC, et 

si PTRID (n) - PTRID (n-1) < PRM, ou le x parametre de 
proximite' PRM represente l'6cart maximal des numeros de 

20 pages de donnees que deux RID consecutifs provenant de 
la lecture d' index ne devraient pas d<§passer, sauf en 
cas de trou dans la sequence, les deux pages PTRID (n) et 
PTRID (n-1) sont probablement voisines et on double la 
valeur de 1' increment autoris<§ INC, a defaut INC reste 

25 inchange; dans les deux cas on ignore le RID avec un 
retour a 1' operation [302] ; 

[304]- Si le RID designe une page PTRID presente dans la 
memoire tampon MT (y compris apres la lecture [303A] ) , 
il suffit pour cela que le numero de page soit entre les 

30 bornes puisque que la memoire tampon MT contient des 
pages non vides contigues, on ecrit la ligne 
correspondante sur le fichier des lignes ordonnees ST1 
et on divise 1' increment autorise INC par 2, pour autant 
que le rdsultat ne soit pas en dessous de sa valeur 

35 minimale ; retour en [302] 

[305] - une fois traite tous les RID disponibles, on 
vide vers le fichier FT2 toutes les pages restantes de 




la memoire tampon et eventuellement toutes les pages 
de 1' espace de tables encore non lues. 

La methode de lecture et de dechargement ci-dessus 
5 IsEC/S^BIiE/BEORG/T^BIaE est appliquee de la fagon suivante 
pour la reorganisation des bases de donnees indexees de 
type espace de tables. 

En particulier on utilise comme methode de 
10 reorganisation unitaire d'une base de donnees indexee 
organisee en espace de tables, la methode REORG/T&BLE 
comportant les operations suivantes (voir figure 8A) : 
[401] - Lecture sequent ielle et simultan^e du contenu de 
1' index et du contenu de 1' espace de tables et creation 
15 des fichiers de lignes de donnees WT1 et FT2; 

[402] — Si necessaire, tri du y fichier FT2 par ordre de 
cle primaire croissante et Eventuellement par ordre de 
table croissante s^il y a plusieurs tables; 
[403] — Fusion virtuelle des fichiers de lignes FT1 et 
20 FT' 2; 

[404] - Rechargement du ou des fichiers contenant 
1' espace de tables avec les lignes ainsi ordonn§es ou 
triees en respectant les parametres d' espace libre ; 
[405] - Rechargement de 1' index primaire de chaque table 
25 dans le merae ordre en prenant en compte le nouvel 
emplacement (RID) de chaque ligne; 

[406] — Mise a jour des autres index soit en modifiant 
les RID soit en les rechargeant apres tri des 
informations de cle et de RID. 

30 

En ce qui concerne la reorganisation de 1' index ou d'une 
partition d' index de la base de donnees indexee, celle- 
ci est susceptible , entre autres, de mettre en ceuvre (en 
variante de la methode de lecture et de dechargement 
35 . d f index illustree a la figure 6A) la methode de lecture 
et dechargement d' index de base de donnees indexee de 
type espace de tables a l'aide la memoire tampon MK et 
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realisee par la methode ISC/XM)/HEOSl6/IHD(ET) comportant 
les operations suivantes (voir figure 6B) : 
[201] - Autant de fois que necessaire jusqu'a avoir 
atteint la fin de 1' index et vide la memoire tampon 2£K, 

5 lecture sequentielle des pages de 1' index en ne 
conservant que les pages d' index contenant au moins une 
cle, jusqu'a remplir la memoire tampon ou atteindre la 
fin de 1' index ; cette lecture se faisant dans les 
emplacements non utilises de la memoire tampon ou 

10 contenant une page marquee invalide; 

£202] - Recherche et remplacement des pages invalides 
dans la memoire tampon de 1' index a partir de la 
premiere page de la memoire tampon MX, 

[206A] - Verification dans chaque page courante de la 

15 m6moire tampon : 

- de 1' absence d'au moins un couple cle-RID superieur au 
dernier couple cle-RID traite en sequence logique (ecrit 
dans le fichier index trie FX1 ou envoye en lecture 
d'espace de tables/base de donnees) ; ou 

20 - de 1' exactitude de 1' expression PXC < PXL - DMA. oh PXC 
represente le numero dans 1' index de la page courante de 
la memoire tampon MK, PXI* le numero dans 1' index de la 
derniere page d' index lue et Dm la difference maximale 
autorisee entre pages d' index en cours de lecture; 

25 ( 2 02' B) - Dans 1' affirmative d'au moins une des deux 
propositions, ecriture des couples cles - RID dans le 
fichier tri- index FX2, invalidation de la page courante 
PXC et retour a 1' operation (201) pour lecture d'une 
nouvelle page index en sequence; a defaut on execute 

30 (203) ; 

[203] - Recherche de la page valide PSmin de la memoire 
tampon MX qui contient la cle la plus basse de toute la 
memoire MX ou en cas d'egalite de cle, le RID 
correspondant le plus bas; 
35 [204] - Traitement de la page PSain en sequence logique 
comportant les operations suivantes : 

[204'A] - Lecture par ordre croissant de chacun des 
couples cle-RID de cette page PXm±n et ecriture directe 
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d e ces couples cle-RID dans le fichier index ordonne 

[204CJ - Invalidation de la page FSsais traitee et retour 
& l f operation (201) pour lecture d'une nouvelle page 
5 index en sequence* 

Ainsi le dechargement de 1' index selon cette derniere 
m6thode conduit a la creation d'un fichier virtuel EW 
ordonne des couples cle-RID et la methode REORG/IHD (ET) 

10 de reorganisation de 1' index de la base de donnees 
indexee et organis§e en espace de tables comporte alors 
les operations suivantes (voir figure 8B) : 
[4012£] - Lecture du contenu de 1' index et creation des 
.fichiers de couples cl6-RID F33L et FX2; 

15 [402X3 ~ Si n^cessaire, tri du fichier FX2 par ordre de 
couples cle-RID croissants pour donner FX' 2; 
[403X] - Fusion virtuelle des fichiers FS1 et F3£'2; 
[4042C] - Rechargement du ou des fichiers contenant 
1' index avec les couples cl6-RID ainsi ordonnes ou tries 

20 en respectant les parametres d r espace libre. 

II est a remarquer que 1' absence de 1' operation de tri 
[402] et/ou [402XJ resulte du fait que la lecture des 
lignes de 1' espace de tables et/ou des pages d' index a 
25 pu etre faite directement dans 1' ordre, ce qui advient 
lorsque la base de donnees n f est pas trop desorganis^e. 

Ainsi 1' utilisation de la lecture sequent ielle qui 
permet de lire un grand nombre de pages en une seule 

30 operation (les unites de disques du systeme possedant 
une fonction de lecture en masse de blocs contigus) 
accelere de fagon significative les operations de 
reorganisation unitaires des bases de donnees indexees, 
notarament les bases de donnees indexees de type espace 

35 de tables. 

II est & noter pour terminer ce point de reorganisation 
unitaire que si les deux methodes de reorganisation de 
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la base de donnees KEORG/T&BLE et de reorganisation de 
1' index BEORG/IS3D (ST) peuvent etre mises en ceuvre 
conjointement, il apparait qu'en pratique ces deux 
methodes sont codees separement et mises en ceuvre comme 
5 des coroutines. Cette caracteristique est importante car 
elle donne plus de souplesse dans la preparation des 
plannings de reorganisation de 1' ensemble des bases de 
donnees indexees notamment de type espace de table. 

10 Apres avoir presente les grandes lignes de la 
reorganisation unitaire des bases de donnees indexees 
structurees en espaces de tables et de leurs index, il 
importe de revenir a la strategie globale de la 
reorganisation de 1 ensemble des bases de donnees du 

15 systeme d' information. 

I.a creation des reorganisations « en ligne » 

La Strategie 

La strategie globale integre les reorganisations « en 
20 ligne » et « hors ligne ». Pour chaque objet du systeme 
informatique d' information on determine le seuil de 
disorganisation a partir duguel une reorganisation « en 
ligne » est rentable. Si ce seuil est atteint sans qu' il 
est ete possible de reorganiser 1' objet « hors ligne » 

25 (manque de disponibilite dans la fenetre « batch ») la 
reorganisation « en ligne » est lancee des que 
l'activite de raise a jour est suffisamment faible pour 
que cette reorganisation soit valable. Cette 
reorganisation « en ligne » se fait en une seule 

30 operation sur une copie de 1' objet en service. Les mises 
a jour eventuelles apparues pendant 1' operation de 
reorganisation sont sauvegardies sur un fichier 
intermedial re traite en fin de reorganisation (les pages 
modifiees etant reperees par l'heure de la 

35 modification) , le processus etant repete pour les 
nouvelles mises a jour eventuelles jusqu'a epuisement. 
L' objet (la base de donnees) une fois reorganise et mis 
a jour peut alors etre remis en service. 
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En ce qui concerne les espaces de tables , c'est 
1' utilisation des parcours sequentiels d' index , (en 
anglais index scans) par 1' index primaire (index 

5 determinant le critere de tri de la reorganisation) qui 
determine la reorganisation des espaces de tables. En 
effet un espace de tables utilise seulement en acces 
direct n'a pas besoin d'etre reorganise car les 
cartographies d' espace (en anglais space maps), seules 

10 utilisees pour determiner la possibility d f une 
insertion, sont suf f isamment peu nombreuses pour etre 
conserver dans le pare de memoires tampons (en anglais 
buffer pool) • 

15 En ce qui concerne les index, l'acces direct (par 
pointeurs verticaux) a 1' index est utilise aussi bien en 
lecture qu' en mise a jour (c.a.d. modification du champ 
de donnees sauf indication contraire) . Son temps 
d' Entree/Sortie est determine par le fait que les pages 

20 representant les deux derniers niveaux et qui dans la 
plus part du temps doivent etre lues physiquement f sont 
ou non proches l'une de 1' autre sur le disque. C'est le 
temps de positionnement pour la lecture de la page 
« feuille » qui determine la difference entre un index 

25 bien ou mal organise. 

Le parcours sequentiel (« index scan » utilisant des 
pointeurs horizontaux) ne represente qu'un cout marginal 
par rapport a la lecture concomitante de 1' espace des 

30 tables, tout en ayant le meme critere de perf ormance que 
l'acces direct puisque si deux pages sont proches d'une 
troisieme elles sont relativement proches l'une de 
1' autre. Le parcours sequentiel n' intervient done pas 
dans la determination de la necessite d'une 

35 reorganisation . 




Les Donnees utilisees 

II resulte de ce qui precede que les donnees a prendre 
en compte sont celles qui influent sur les performances 
des applications et sur le cout en termes de ressource 
5 de la reorganisation. Ces donnees sont de deux ordres 
ayant leurs origines soit dans les caracteristiques de 
l'objet a reorganises soit dans les caracteristiques 
des unites du systeme d' information (traitement et 
utilitaires) : 

10 i) les caracteristiques de l'objet a prendre en compte 
sont celles de determinent le volume est 1'etat de 
l'objet : 

S = le nombre de CI (bloc physique ou page) de 4 Ko de 
l'objet, index compris en cas d'espace de table, 
15 NTL = le nombre total de lignes (RID si index) , ou le 
nombre moyen par CI, 

D= le taux de disorganisation, c'est a dire : 
Pour un espace de tables : 

DT = le pourcentage de lignes situees loin de la page 
20 qui contenait a 1'origine la cle precedente au sens de 
1' index primaire ; 
Pour un index : 

DI = le pourcentage de pages feuilles situees loin de la 
page non feuille qui pointe dessus. 

25 

Pour calculer le nombre de lignes ou de RID on divise la 
taille utile du CI multiplie par le taux de remplissage 
estime, par la taille typique de 1' entree. 

- La taille utile d'un CI est voisine de 4 K pour un 
30 espace de tables et depend de type de 1' index et du 

nombre de sous pages et de la longueur des cles pour un 
index de type 1. 

- Le taux de remplissage estime de 0,85 pour un espace 
de tables et de 0,75 pour un index. 

35 - La taille typique est la moyenne geometrique (racine 
nieme du produit de n nombres) entre la taille maximum 
et la taille minimum (tmg 2 = tmax.tmin) . Pour un index 
multiple la taille du RID est le minimum, la taille 



d'une entree unique le maximum- Pour un espace de tables 
ajouter 8 (prefixe + ID) a la taille de la ligne (a 
diviser par 3 en cas de compression) . 

5 ii) Les caracteristiques des unites a prendre en compte 
sont celles qui influent sur le temps d' Entree/Sortie 
des traitements et utilitaires : 

- le temps de positionnement moyen Ts; 

- le temps de latence Tl, c'est ga dire le temps 
10 necessaire pour faire un H tour ; 

- le nombre de blocs de 4K par piste de memoir e sur 
disque . 

Est 6galement a prendre en compte le profil applicatif 
15 (c'est a le nombre moyen d'un evenement de 1' application 
par unite de temps, par exemple 1' heure) . 

Pour un espace de tables, 1' information utilis^e sera le 
nombre moyen de lignes lues par « index scan » (parcours 
20 sequentiel de 1' index) par heure. En fait remarquer 
qu'il n'est r<Sellement utile de reorganiser un espace de 
tables que s'il y a des lectures en « index scans ». 

Enfin on s'interesse a la charge instantanee lorsque 
25 1'on cherche £ determiner 1' opportunity de lancer une 
reorganisation « en ligne » & un instant donne. Jusqu'a 
present on utilise le nombre moyen de mise jour par 
objet et par heure. II serait opportun de travailler sur 
des previsions a court terme de cette charge en 
30 utilisant des profils de journee d' exploitation. 

Le Cout de la reorganisation : 

Le cout d'une reorganisation en ligne, exprime en temps 
d'Ent re /Sortie est donne par la formule Fl suivante : 

35 

C = S. (c + d.D) / (1 - e.q.U) dans laquelle : 

S est le nombre de pages ou taille de 1' objet, index 

inclus ; 



D est le taux de disorganisation ; 

e,d,e sont des constantes de la machine (systeme 
inf ormatique) ; 

q = 1 si l'objet est un index, 
sinon ©; = nombra d' index +1 ; 

U est la raoyenne horaire du nombre de raises a jour sur 
l'objet, les raises a jour etant pour 1'essentiel des 
modifications de champs dans des lignes existantes (sans 
veritable ef fet de disorganisation) . 

On notera que la duree d' une reorganisation en ligne 
peut etre tres longue (plusieurs heures pour une 
premiere phase de reorganisation en continu de duree to) 
entrainant la raise en memoire provisoire, pendant la 
premiere phase de reorganisation, d'un premier paquet 
des mises a jour de l'objet. A la fin de cette premiere 
phase de duree to (temps passe de reorganisation Tr=to) 
intervient une deuxieme phase de la reorganisation plus 
courte (tl < to) que la premiere pour traiter ces 
premieres mises a jour, d'ou 1' apparition en fin de 
deuxieme phase (avec Tr=to+tl) d'un second paquet de 
mises a jour plus petit que le premier, et ainsi de 
suite jusqu'a extinction des mises jour. II en resulte 
que le temps total final de la reorganisation en ligne 
Tf fait intervenir un facteur k <1 fonction de U moyenne 
horaire du nombre de mises a jour sur l'objet. 

Au depart de la reorganisation Tx = 0 
Pour Tr=fco, C= Co = S . (c+d.D) 

Pour Tr=to + tl, C= Co + k.Co - Co. (1+k) ou k < 1 
Pour Tr=to +tl+ t2, C= Co + k.Co + k.k.Co = Co. (1+k+k 2 ) 
Pinalaaent en fin de reorganisation Tr = Tf, avec: 
Tx=Tf=fco+ .. + tn + , C= Co + k.Co + k 2 .Co + .. +k n .Co+ 
Soit un cofit final C= Co. (l+k+k 2 + ...+k a+ +.)= Co/ (1 - k) 
ou l'on retrouve la formule Fl si l'on pose k= e.q.U 
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De la formule XPl on tire le cout moyen horaire de 
reorganisation si t represente le nombre d'heures 
separant deux reorganisations : 
Ga = IB. (c + d.D) / (1 - e-<g.U)3 / soit FX' 

5 

Le Cout de ne pas reorganiser : 

Le surcout de ne pas reorganiser par heure de traitement 
vaut : C* = Co*.D, ou Co* est le surcout horaire quand 
10 1' ob jet est totalement desorganis6. 

D'une fa<?on generale on consid^re que la disorganisation 
d'une base de donnees de type espace de tables r£sulte, 
quasi exclusivement des insertions de donnees dans la 
15 base (nouvelles lignes creees) , soit : 
D = ±/S*ir, ou 

i designe le nombre d' insertions depuis la derniere 
reorganisation, 

S designe la taille de l'objet entier en pages , 
20 r est le nombre moyen de lignes par page de 1' entier , 

Si l'on suppose le taux horaire d' insertion constant = I 
D = I.-t/S.r => C* = Co^-I.fc/S.r ou 
I designe le nombre d' insertions a l'heure, et 
25 t le temps 6coule depuis la derniere reorganisation. 

Le surcout de ne pas avoir reorganise depuis t heures 
est G = Soiame de Co*.X.t.dt /S.r = H .Co*.X.t 2 /S.x soit 



ou Sosme da designe le signe mathematique de la fonction 
integrale. 



G = H Co*.D.fc 
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Le surcout moyen horaire de ne pas avoir reorganiser 
vaut done : Cm* = H .Co^.D formule F2 



5 
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: 

Le moment optimal de la r eorganisation : 

Le cout moyen horaire total de la non reorganisation 
vaut :Cmt = Cm + Cm* 

II importe de reorganiser lorsque Cmfc = Cm + Cm* est 
minimal - 

Or 

Cm = [S.(c + d.D) / (1 - e.q.U)] / t soit avec S = I.t/D 
Cm - I.(e + d.D) / (1 - e.q.U) .r.D formule Fl" 

Cmfc = Cm + Cm* - H.Co* .D+[I . (c + d.D) / (1 - e.q.U) .r.D] 

soit la formule F3 

Cette fonction du type a.x + b + c/x passe par un 
minimum lorsque a - (c/x* )= 0 soit = c/a, d'ou pour 
la valeur de seuil Ds solution de 1' equation suivante : 
Ds 2 = 2 I. a / (1 - e.q.U) n Co* formule F4 



Alternativement on montre que la fonction Cm1s=Cm+Cm* 
admet un minimum lorsque les termes en D et en 1/D sont 
egaux {m.x = c/x) , soit : I.C / C d - e.q.U) .r.D] = 
*S .Co*.D 

25 D'ou on retrouve la formule F4. 

II y a lieu de reorganiser lorsque D 2 depasse cette 
valeur Ds 2 , soit quand : 

D 2 > 2 I.c / (1 - e.q.U) r Co* ou, sous une autre forme, 
30 quand 

R' = D 2 r Co*.(l ~ e.q.U) / 2. I.c > 1 
Ou quand R' = R (1 — e.q.U) >X avec 
r = d 2 r Co* / 2. I.c , soit la formule F5. 

Sachant que e.q.U doit etre le plus faible possible, la 
35 reorganisation en ligne interviendra pendant que U 
(moyenne horaire du nombre de mise a jour sur l'objet) 
est faible a partir du moment ou R XL. 
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Ainsi le taux de seuil Ds fcst donne par la formule F5 f 
suivante: R = Ds 2 r Co* / 2.I.C = 1 

i) Cas de 1' Xndes 

5 Si l'objet est un Index, chaque insertion coute » 
lectures et 1 ecriture si n est le nombre de niveaux 
d' index et chaque relecture coute n lectures „ En 
supposant 3 niveaux d' index le temps d' acces 
correspondant aux deux derniers niveaux sera : 

10 - T& + 2. TX, si 1' index est r<§organis£ 
- 2Ts + 2 Tl, si 1' index est disorganise 

T& designant le temps de deplacement de bras, Tl le 
temps de latence (1/2 tour du bras). En cas d' index 
disorganise le surcout en temps d' acces par transaction 
15 est de Ts, 



Si t* est le taux de relecture de l'objet, c'est a dire 
le nombre moyen de fois qu'une entr<§e sera relue. II est 
alors possible de coniiaitre le nombre de transactions en 
20 fonction de I (nombre d' insertions a l f heure) soit : 
1) I - 

II en resulte que le surcout horaire a ne pas 
reorganiser quand l'objet est totalement desorganise Co* 
25 est Co* = 1) X.Ts formule FS 

On peut evaluer c (temps d' acces en E/S par la taille) 
en supposant dans le cas le plus defavorable que 
1'utilitaire de reorganisation « en ligne » lit une 
30 piste a la fois puis perd son posit ionnement, done en 
negligeant les ecritures. 

c=(Ts + 3T1) /Hbp o\x Kbp est le nombre de pages de 
l'objet. 

35 

En posant Ts/Tl » V qui est une caracteristique de 

1' unite de traitement on obtient 

R= D 2 r (t*+l)B5bp.V / [2 (V+3) ] formule F7 
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Ainsi le taux de seuil pour 1' index Dsl est donne par la 
formule F7' suivante : R= Dsl 2 r (t*+l)Nbp.V / [2 (V+3)] 
= 1 

5 

A titre d'exemple numerique non limitatif, on choisit : 
r= 200 (cle de longueur 10 octets) 
!3bp : 12 (3390) 
V = 1.76 (3390-2) 
10 t* = 1 (une seule relecture) 

On obfcient R = D 2 200.2.12.1,76/ 2.4,76 = D 2 8400/9,52 
soit R = 887 .D 2 

II y aura lieu de reorganiser a partir de R > 1 (lorsque 
le taux U pent etre considere comme negligeable ) , soit 
15 pour D 2 > 1/887 ou D > 0,0335, soit a partir d'un taux 
de seuil de disorganisation de 1' index Ds = 3,35 %. 

ii) Cas de 1 ' e space de tables 

Si 1' ob jet est un espace de tables, une lecture 
20 sequentielle d' index (index scan) engendrera un surcout 
de disorganisation par ligne deplacee de Ts + Tl. 

II en resulte un cout de disorganisation 
Co* m L.I. (TS + Tl) 
25 ou L est la proportion des lignes accedees par index 
scan par rapport aux lignes creees. 

Par ailleurs du fait que les index sont reorganises 
simultanement, il faut tenir compte du cout associe aux 
30 acces directs a travers ces index, 
soit Co*i = (t*i + D.Ii.Ts 

d'ou le cout total moyen horaire a ne pas desorganiser 

Cm* = ^.L.I.D. (Ts+Tl) + H [S Co*i. Di 2 . /D 2 ] . D 

Soit 

35 Cm* = H.L.I.D. (Ts+Tl) + *s Ts. E li.Di 2 . (t*i + 1) /D 
formule F9 



II est a noter : 

- que Ii = I dans le cas d'un espace de table monotable; 

- que dans le cas general on peut supposer que Ii = fei.X 
ou ki designe le cardinal relatif de la table associee a 
l r index i (et representatif de la dimension relative de 
cette table) . Cela revient a ignorer les mises a jour 
entrainant une modification de cle et a supposer que les 
tables ont des durees moyennes de vie de lignes 
comparables - 

- que les t*i representent le taux d'acces direct au 
travers de chaque index done que, pour une table donnee, 
2 t*i represente le coiit d'acces a cette table. 

Supposons certaines reorganisations d' index faites, dans 
chaque intervalle ne contenant pas de reorganisation 
d' index, Di est une f onction lineaire du nombre 
d' insertions I done de D. 

Di = ai.D - bi, ou'ai - Ii.S.r / (I.Si.ri) - ki / ki= 1 
d'ou Di = D-bi 

Cm* = H.L.I.D. (Ts+Tl) + H Ts. S Ii. (D-bi) 2 - (t*i + X) /D 

Cm* = H.L.I.D. (Ts+Tl) + *s Ts. 2 Ii.D. (t*i + 1) 

- Ts. S Ii.bi.(t*i + 1)+ H S. li.bi 2 . (t*i + 1> /D 

avec Cm = I.(c + <£.D) / (1 - e.q.U) .r.D (cout moyen 
horaire pour reorganiser l'objet) 

De facon analogue a ce qui a deja ete presente ci-avant 
la fonction Cart = Cm + Cm* admet un minimum local 
lorsque les termes en D et en 1/D sont egaux soit : 
D 2 . [L.I. (Ts+Tl)+Ts. S Ii.(t*i + l)]=2I.c/(l - e.q.U) .ar + 
Ts. E Ii. D 2 . (t*i +1) 



D 2 .L.I. (Ts+Tl)+Ts. S Ii(D 2 -bi 2 ) (t*i +l)=2I.c/ (1-e.q.U) .r 
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En utilisant comme ci-devant c = (Ts + 3.T1) / S3bp et en 
substituant bi = D - Di on obtient 

R=r.X^p[D 2 .L (V+l) -«- V. S ki(2DDi-Di 2 ) (t*i+l)]/ (2V+6) 
5 Formula F12 
Ou 

R= r.Nbp[D 2 .It (V+l) + V. 2 ki(D 2 -bi 2 ) (t*i+l)]/ (2V+6) 
Formula 12' 

10 Pour une base de donnees monotable on a ki= 1, la 
formule devient 

R= r.Wbp[D 2 .I. (V+l) + V. 2 (D 2 -bi 2 ) (fc*i+l) ] / (2V+6) 
Formule F13 

15 Ainsi le taux de seuil DsT est donne par la formule F13' 
suivante: F13' suivante : 

R=r.Nbp[DsT 2 .I. (V+l) + V. 2 (DsT 2 -bi 2 ) (t*i+l) ] / (2V+6) = 
1 

20 A titre d'exemple numerique non limitatif, on choisit 

pour un espace de table monotable a 2 index: 

r= 15 (ligne de longueur 200 octets ; index 15% de la 

taille de 1' espace de table) 

Nbp : 12 (3390) 
25 V = 1,76 (3390-2) 

L = 5 (chaque ligne fait l'objet de 5 parcours 

sequentiels dans sa vie) 

rl = 200 (cle de longueur 10 octets) 

r2 - 230 (cle de longueur 8 octets) 
30 t*l = 1 (une relecture directe) 

t*2 = 2 (2 relectures directes) 

En procedant comme presente ci-avant, il apparait que le 
premier index II (Rl = 887. Dll 2 ) doit etre reorganise a 
35 partir de Dsll= 0,0355 = 3,35% et que le second index 12 
(R2 = 1531. DI2 2 ) doit etre reorganise a partir de DsI2 = 
0.0255 = 2,55%. 
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La base de donnees etant monotable on a k±« 1. La 
formule F12' se simplifie pour s'ecrire : 



R= (15.12)/(2. (4,76)) [(D 2 .5. (2,76)) + (1,76.2 (D 2 -bl 2 ) ) + 
(l,76.3(D 2 -b2 2 )) 



R=180/9,52 [{13, 8. D 2 + 3,52.D 2 + 5,28. D 2 ) - (3,52.bl 2 + 
5,28.b2 2 ) ] 

Soit R= [427. DsT 2 - 66,5.bl 2 - 100 Jb2 2 ] /10 . 000 = 1, 
10 formule P14, si les valeurs DsT, bl et b2 sont 
directement ©sprisnees en % (pourcent) . 

II est clair de la formule F14 que la valeur de seuil de 
reorganisation de l r espace de table DsT sera superieure 
15 a la limite D±nf solution de 1' equation 

D±nf 2 « 10.000/427= 23,4 , soit Dinf= 4,8 %. 

Apres une reorganisation de 1'espace de table et de ses 
deux index, tous les taux de .disorganisation sont a zero 
20 avec DT = DI1 = DI2= 0. 

La premiere reorganisation d' indexinterviendra pour 
DsI2 = 2,55% 

(a un instant ou la base de donnees et le premier index 
25 auront le meme taux DT = DI1= 2,55% « Dinf ) , les taux 
etant proportionnels aux nombres d' insertion de 
nouvelles lignes (ou RID pour les index) . 

La seconde reorganisation d' index interviendra pour 
30 DsXl = 3,35% (a un instant ou la base de donnees aura le 
meme taux DT = 3, 35% (< Dinf) ) . 

En supposant pour simplifier que les index puissent etre 
reorganises des que le taux ou seul limite est atteint, 
35 on peut examiner chaque intervalle d6fini entre deux 
reorganisations successives d r index et calculer par la 
formule F13 la valeur dans cet intervalle du taux limite 
pour 1'espace de table (les valeurs de bl et de b2 etant 



soit 
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donnees par la valeur ins tan tanee de la disorganisation 
de l'espace table Ds lors des deuis dernieres 
reorganisations d' index) et verifier que cette valeur 
limit© appartient bien a 1' intervalle consider© ; a 
5 defaut l f intervalle considere et la valeur limite 
calculee ne seront pas retenus. 

On etudiera done la suite d' intervalles suivante : 
[0:Dsl2] , [DsI2:DsIl] , [Dsll:2 .Dsl2] , [2 .DsX2 :2 .Dsll] , etc 

10 ou 2.Dsl2 et 2. Dsll correspondent respectivement a la 
secpnde reorganisation du second et du premier index. 

En introduisant les valeurs numeriques la suite 
d' intervalles peut s'ecrire : 

15 [0:2,55] , [2 r 55:3,35] , [3,35:5.1] , [5,1:6,7] , etc 

Compte tenu de la valeur de Dinf=4,8%, il y a lieu 
d'etudier l f eventualite d r une reorganisation de l'espace 
table dans lfintervalle [3,35:5,1], avec bl= 3,35 et 
b2=2,55 (valeur de Ds lors de des deux premieres 

20 reorganisation d' index - premiere de II et premiere de 
12) 

De la formule F14, on obtient DsT 2 =11380/487 =26,5 et 
DsT= 5,15% 

25 

Cette valeur n'est pas acceptable car elle se situe en 
dehors de 1' intervalle considere. II en resulte que la 
reorganisation de l'espace table ne pourra intervenir 
qu'apres la seconde reorganisation du second index I 
30 pour laquelle DsT prendra la valeur 2a: 2,55= 5,1. 

En reprenant cette procedure pour 1' intervalle 
[5,1:6,7], avec bl= 3,35 et b2= 5,1, obtient 
DsT 2 =13231/487= 31 et DsT= 5,56%. 

35 

Si on prend U=0 la reorganisation de l'espace table et 
de ses deux index est souhaitable a partir d'un taux de 
disorganisation de 5,56% survenant dans 1' intervalle 
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considere a un instant precedant bien la seconde 
reorganisation du premier index. 

II est a noter en variante qu' il est interessant 
5 d'appliquer egalement le critere de ren1^>i>±Xi<fce presente 
ci-avant a la reorganisation « hors ligne » (hi) dans la 
mesure ou des donnees existent. Pour ce faire, il y a 
lieu de remplacer dans la formule Fl le coefficient 
c(el) (temps d' Entre/Sortie en fonction de la taille de 
10 1' objet) par un coefficient correspondant a la 
reorganisation « hors ligne », par exemple du type o(hl) 
= K.c(el) ou K = Rapport du temps d' execution de la 
reorganisation (hi) de l'objet sur le temps d' execution 
de la reorganisation (el) du meme objet dans des 
15 conditions moyennes d' exploitation de la base de donnees 
index^e de type espace de table correspondante . 

II est ainsi possible de determiner si une 
reorganisation « hors ligne » est ou non utile. Les 
20 priorites existantes basees sur les taux de 
disorganisation sont egalement remplacees par des 
prioritds basees sur la rentabilite, un objet plus lu 
qu'un autre etant prioritaire pour la reorganisation & 
taux egal de disorganisation . 

25 

I^a gestion glofoale des reorganisations et copies « hoys 
ligne » : 

La reorganisation d f un fichier « hors ligne » est 
30 consomraatrice de temps machine qu' il est en general 
souhaitable de minimi ser pour reduire le cout total de 
1' operation • 

Pour ce faire 1' invention propose egalement une methode 
35 de gestion ou d' ordonnancement preparee d'avance de 
1' execution en temps reel de programmes utilitaires de 
reorganisation (et/ou d' images copie) de maniere a 
utiliser au mieux les ressources du systeme informatique 
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d' information dont la f enetre « batch » (f enetre de 
maintenance) - 

La reussite et l'efficacite d'une telle methode repose 
5 sur la rapidite que ce soit la rapidite a preparer et a 
mettre a jour un plan d' activite ou planning des taches 
a executer et/ou la rapidite a lancer 1' execution des 
programmes preselectionnes- 

10 Avant d'exposer la methode de gestion ou 
d'ordonnancement selon 1' invention, il importe de 
presenter brievement 1' organisation et le fonctionnement 
d'un systeme informatique d' information comportant un 
ensemble de fichiers ou bases de donnees indexees 

15 repartis en divers objets reels constitues d'espace de 
tables, de partitions d'espaces de tables et d' index. 

Le systeme d' information ; 

Les capacites « machine » du systeme d' information sont 
20 divisees en regions de traitement distinctes pilotees de 
facon unitaire par une region de contr61e. A cheque 
region de traitement sont affectees un certain nombre de 
taches ordonnees et sont allouees les ressources 
necessaires en memoires virtuelles et peripheriques 
25 (disques durs, imprimantes, memoires sur supports 
externes etc.). Par souci d' ef f icacite en execution et 
en allocation de ressources materielles et/ou 
logicielles on affecte si possible a chaque region de 
traitement des taches de meme type, telles que par 
30 exemple pour des taches generalement executables dans la 
fenetre « batch » des reorganisations de fichiers ou 
bases de donnees (demandant beaucoup d'espace de disque) 
ou des copies images de fichiers (demandant des 
peripheriques de sortie externe, lecteurs de bandes 
35 magnetiques, lecteurs /graveurs de CD-ROM, etc..) . 

A cote des reorganisations de fichiers tels que bases de 
donnees, la prise de copies des fichiers modifies 




const itue un imperatif de s6curite dans le domaine de 
1' exploitation de systemes inf ormatiques . On distingue 
generalement trois types de copie, la copie en continue 
ou copie « journal » (en anglais « log ») , la copie 
5 incrementale qui ne prend que les modifications 
apportees aux fichiers et la copie totale ou copie 
image . 

En ce qui concerne les bases de donnees, les systemes 
10 d' exploitation comportent assez souvent un dispositif 
logiciel de verrouillage interdisant la remise en 
service de la base de donnee avant la prise d'une copie 
image. Ceci cree une interaction, entre les plannings de 
reorganisation et de copie. 

15 

Les plannings 

Les plannings de reorganisation et de copie s'effectuent 
a partir de listes de priorites d' objets a reorganiser 
20 ou a copier qui seront traitees dans des regions de 
traitement differentes reservees soit a la 
reorganisation soit a la copie. 

La methode d'ordonnancement consiste a generer a 
25 1'avance les objets reels susceptibles de reorganisation 
au lieu de faire des combinaisons d' objets en temps 
reel. Le nombre d' objets en est plus grand pour les 
objets partitionnes, mais les priorites et par 
consequent 1'ordre logique d' enchainement des 
30 reorganisations sont calcules initialement et rarement 
mis en cause- 

De ce fait les objets a reorganiser peuvent etre chain^s 
par priorite decroissante, meme si certains sont 
35 mutuellement exclusifs. 

La copie utilise d' autres regions et peut travailler sur 
les objets elementaires. La liste des objets a copier 
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est done distincte de celle des objets a reorganiser 
avec un lien eventuel pour etablir si un objet a copier 
est aussi a reorganiser ou fait partie d'un objet a 
reorganiser. 

Le processus d' ordonnancement ou de creation de 
plannings pent se resumer de la facon suivante que se 
soit pour les copies ou les reorganisations : 

- determination ou preselection des objets a traiter en 
priorite par la realisation d'un planning rapide. 

- tentative de creation d'une liste d'ordre d' execution 
des traitements par placements en « retro-planning » des 
objets preselectionnes par priorites croissantes dans 
des regions de traitements disponibles, ce qui permet de 
s' assurer de l'heure maximum de demarrage d'un 
traitement. Ainsi le dernier objet select ionne dans une 
region avec reussite pour completer la liste devient le 
prochain objet a traiter POC ou POR. A defaut une 
nouvelle tentative de creation de liste sera effectuee 
sur d'autres hypotheses de placements ou d' affectations 
de regions de traitement. 

Ce processus est renouvele a chaque fin de traitement 
correspondant (copie ou reorganisation) en tenant compte 
de l'etat reel des objets a cet instant. 

L'interet de 1' operation de « retro-planning » ou 
planning inverse est de permettre a des gros objets non 
necessairement prioritaires d'etre traites avant qu' il 
ne soit trop tard (le temps de traitement encore 
disponible dans la fenetre « batch » des regions de 
traitements libres devenant insuffisant) . 

Dans la realite, les temps d' execution sont variables et 
il y a lieu de prendre une marge de securite concernant 
les temps d' execution (Kc = 1,20 pour les copies et 
Kr = 1,50 pour la reorganisation). 



# • 
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En pratique chaque f ois d' une region destinee a la 
reorganisation devient libre, 1' algorithme de planning 
de reorganisation recherche 1' objet reel dont la 
priorite est maximale (planning rapide) , le 
5 preselect ionne et poursuit les tentatives d' affectations 
sur le meme principe en examinant les consequences sur 
sa- selection initiale (premier objet a reorganiser) . En 
particulier : 

- si 1' objet en phase d' affectation est une partition 
10 contiguS a une partition d'un meme espace de table deja 

selectionnee en premier, cette nouvelle partition sera 
ajoutee a la selection initiale a titre d'objets lies 
dans la mesure ou le nombre maximum de partitions 
selectionnees pour etre traitees ensemble n'a pas encore 
15 <§te atteint (toutes les partitions contigues 
selectionnees seront reorganisees en m§me temps) ; 

- si 1' objet en phase d' affectation est 1' espace de 
table dont 1' objet de la selection initiale est un 
index, l r espace de table (et ses index) remplacera 

20 1' index de la selection initiale et les eventuelles 
selections des autres index seront annules (les index 
d'un espace de table sont tou jours reorganises avec 
celui-ci) . 

25 Le processus sera partiellement reexecute a chaque 
modification de 1' objet selectionne en premier 
(selection initiale) . De ce fait si de nombreux espaces 
tables du systeme d' information sont partitionnes, le 
nombre de remise en cause peut devenir important. 

30 

De fagon analogue chaque fois d'une region destinee a la 
copie devient libre, 1' algorithme de planning de copie 
recherche 1' objet 61ementaire dont la priorite est 
maximale (planning rapide) , et refait un planning de 
35 reorganisation pour verifier si cet objet est prevu ou 
non pour une reorganisation dans la fenetre « batch ». 
Dans l f affirmative 1' objet est enleve provisoirement du 
planning des copies • 
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Par ailleurs, les priorites sont comparees entre les 
listes ^reorganisation' et les listes *copie' ; des 
images copies plus prioritaires sont susceptibles 
d'empecher une reorganisation du seul fait que celle-ci 
genere une copie et vice versa. 

Le planning rapide 

Le planning rapide consiste a determiner les objets a 
traiter en limit ant le temps global (la charge) a la 
somme des durees disponibles dans les regions de 
traitement . 

Le planning rapide de la copie consiste a prendre les 
objets dans l'ordre decroissant des priorites il est 
done aussi simple a realiser qu'un tri d'objet. II 
permet de donner une evaluation rapide du temps de 
fenetre residuel en fonction de la priorite. II peut 
etre ajuste en fonction des objets ajoutes par le 
planning rapide de reorganisation. 

Le planning rapide de reorganisation prend en compte les 
liens entre objets reels : 

- si un ob jet est contenu dans un autre, on planifie le 
contenant ; 

- si deux objets ont une partition commune sans que l'un 
contienne 1' autre, on planifie celui qui a la plus haute 
priorite. 

Le planning rapide de reorganisation travaille egalement 
dans l'ordre decroissant mais il est capable de remettre 
en question 1' elimination de gros objets en fin de 
f enetres . 

La rapidite des plannings rapides tient a ce qu'ils sont 
limites dans leurs retours en arriere et ne remettent 
pas en cause les priorites des objets. 
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La boucle la plus interieure est celle qui cumule les 
temps de copie en testant si un objet est a la fois 
copie et reorganise. II est possible d' introciuire un 
5 curseur sur 1' objet a copier, sachant que le parcours 
complet n'est necessaire que si des incompatibilites ou 
remise en causes ont et6 detectees. 

Les priorites 

10 

Les priorites relatives de copies et reorganisation sont 
prises en compte de maniere suivante : 

Pour les reorganisations necessitant une image copie, on 
15 verifie qu'elle est possible (planning rapide) en 
tentant d' inserer 1' objet (s'il n r y est pas deja) au 
planning provisoire de copie avec sa priorite de 
reorganisation . 

20 Ainsi si ce sont les regions de copie qui limitent le 
nombre d' objets, cette limite se fera a des priorites 
voisines tant pour la reorganisation des objets 
necessitant une image copie que pour la copie des autres 
objets* 



Par contre si ce sont les regions de reorganisation qui 
limitent le nombre d' objets, des copies d r objets 
beaucoup moins prioritaires peuvent avoir lieu. 

30 Les specifications de la itiethode de gestion et 
d' ordonnancement de 1' execution de logiciels utilitaires 
de reorganisation de bases de donnees indexees . 

Les Donnees 



Les objets elementaires 

Les objets elementaires sont les plus petits objets 
susceptibles d' un traitement (reorganisation et/ou 
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copie) et pour lesquels on est capable de mesure un taux 
de disorganisation. 



Ces objets sont utilises pour 1' image copie et 
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comme 

intermediates pour generer des objets de 
reorganisation . 



Les objets ilementaires pour lesquels une image copie 
est a faire sont chaines (liste PRIOCOPIE) entre eux par 
priorites decroissantes et tallies croissantes (la 
priorite la plus haute etant donnee a l'objet dont la 
derniere copie remonte le plus loin dans le temps) . Les 
a j outs apres reorganisation se font en effet en tete de 
la liste PRIOCOPIE. 



Tous les objets elementaires faisant l'objet d'une copie 
(y compris, ulterieurement, apres leur reorganisation) 
comportent un pointeur de pile dans l'ordre des 
priorites croissantes qui est valorise par le planning 
20 de copie. 



Les objets reels 



Les objets reels sont ceux qui peuvent etre reorganises 
25 sans entrainer la reorganisation d'autres objets (ex ; 
espaces de tables + index non pris isolement) . Les 
objets reels sont crees a partir d' objets elementaires 
(espaces de tables, index et partitions) . 



La priorite de chaque objet reel est le barycentre des 
taux de disorganisation des composants avec leurs 
tallies pour coefficients. On rappelle que le taux de 
disorganisation d'un objet est donne par le rapport 
nombre d' insertions (lignes ou RID) sur la taille de 
l'objet. Les objets reels sont ranges dans la liste des 
priorites de reorganisation (liste PRIOREORG) par 
priorites decroissantes. 




La prior ite etant definie comme le rapport gain / couts, 
le gain d' un objet est calcule comme le produit de sa 
priority par le temps de sa reorganisation. 

5 Les objets reels sont chaines avant-arriere afin de 
permettre le parcours dans les deux sens et les 
operations de suppression et de changement de priorite 
qui ont lieu chaque fois qu'une reorganisation est 
lancee - 

10 

Le planning rapide utilise egalement une liste de 
suppression (liste SUPP) permettant de differer la 
suppression d' objets jusqu'a la confirmation de la 
necessite de ces suppressions par la selection de 
15 1' objet courant incompatible avec les objets supprimes. 

II est possible d' introduire une sous-chaine d' objets 
s<§lectionnes (ou ayant fait 1' objet de tentatives de 
selection) afin d'eviter, lors de la phase de remise en 
20 cause d' avoir a examiner de nombreuses combinaisons de 
partitions incompatibles avec les choix anterieurs. 

L' objet partltionne 

25 Pour un espace de table contenant n partitions il y 2 n -l 
objets reels possibles pour la reorganisation, ce qui 
est irrealiste. On se limite aux combinaisons de 
partitions contigues dans l'ordre des priorit6s soient a 
H n. objets. Si le nombre maximum de partitions 

30 reorganisees simultanement est &<n, le nombre d' objet 
reels se reduit a H p. (2n-p-5-l) . 

Par ailleurs il est necessaire de pouvoir repondre 
rapidement aux questions suivantes : 
35 i) - un objet est-il contenu dans un autre ? 

ii) - deux objets ont~ils une partition commune ? 
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Pour faciliter la reponse a ces questions on associe a 
chaque objet un tableau de bits (en anglais bitmap) 
marque a 1 pour chaque partition de 1' objet et on 
procede a des comparaisons des « bitmaps ». 

Ob jets globaux 

Les ob jets globaux sont les espaces de tables. II sont 
destines a contenir les informations relatives a la 
10 partie planifiee : 

Les informations temporaires utilisees par le planning 
rapide sont : 

- un pointeur vers une liste de ses sous-objets reels 
15 selectionnes, une valeur non nulle indignant qu'une 

partie de 1' objet est a reorganiser ; 

- un indicateur de reorganisation de 1' ensemble de 
l'espace de tables ; 

- un indicateur de copie d'une partie de l'espace de 
20 table ; 

- une « bitmap » des reorganisations des partitions de 
l'espace de tables - 

- une « bitmap » des reorganisations des partitions 
d' index . 
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II y a un pointeur de chaque objet elementaire ou reel 
sur 1' objet global correspondant . 

Enfin les objets reels selectionnes d'un meme espace de 
table sont chaines entre eux par le planning rapide dans 
la liste de selection (liste SELECT/OR) de 1' objet 
global. 

Regions de traitement 

Chaque region de traitement est affectee soit a la copie 
soit a la reorganisation. La recherche du prochain objet 
a reorganiser ou copier a lieu quand une region est 




liberee par la fin de la reorganisation ou la copie 
pr §cedente . 

Le planning consist e done a valoriser un pointeur de la 
5 region de traitement vers le prochain objet a traiter. 

Afin de permettre l f anticipation, on conserve pour 
chaque region l'heure relative estimee de fin du 
traitement en cours dans la region, laquelle est 
10 initialement nulle^ 

Les Traitements : 

Les traitements ci-apres sont donnees a titre d' exeraple 
15 non lisaita-fcif d'un mode d' exploitation de la mise en 
ceuvre de la methode de gestions des reorganisations et 
des copies d'un ensemble de bases de donnees indexees 
selon 1' invention. Sans sortir du cadre de 1' invention, 
ces traitements peuvent faire l r objet de variantes et de 
20 modifications diverses pour remplir des fonctions 
techniquement identiques ou equivalentes . 

&, Planning rapide 

25 On rappelle que le planning rapide a pour seul but de 
determiner les objets pouvant Stre reorganises dans la 
duree residuelle de la fenStre « batch » et non de 
calculer l'heure de debut des reorganisations. Les 
seules informations utilisables sont l r indicateur de 

30 selection de chaque objet reel et les indicateurs 
d r affectation (partie planifiee et pointeurs) . 

Le planning rapide de reorganisation comporte les 

six phases operationnelles suivantes : 
35 Initialisation 

Boucle sur objets 

Elimination des intersections d' objets 
Remise en cause des choice precedents 
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Verification da 1® sufxisance du temps copie 
Selection de 1' objet courant 

La phase operationnelle d' Initialisation comporte les 

5 operations siaivantes : 

- Pour tout objet reel de la liste, annuler 1' indicateur 

de selection IndS/OR ; 

- Pour tout objet global 06 de la liste, annuler le 
pointeur de liste de selection PointLS/OG et annuler la 

10 partie planifiee de 1' objet PPO/OG; 

- initialiser le limiteur de remises en cause a 10.000 ; 

- initialiser E - temps minimum de traitement = minimum 
de (duree unitaire de reorganisation + copie des objets 
reels a reorganiser OR) ; 

15 - initialiser Temps residuel de copie TRC = temps 
restant apres execution des copies en cours et des 
copies liees aux reorganisations en cours ; 

- initialiser Temps residuel de reorganisation TRR - 
temps restant apres execution des reorganisations ; 

20 - initialiser : Prochain Objet a Copier POC = premxer 
objet de la liste finale (en realite une liste virtuelle 
car seul le premier objet de cette liste importe) . 



Hota 
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1) Cette phase d' Initialisation debutant le processus de 
PER* est notamment lancee a chaque fin d' une tache de 
reorganisation (reorg + copie) dans une region de 
traitement correspondante . 

De la meme facon a chaque fin de tache de reorganisation 
les listes de priorites PRIOBEORG pour les objets reels 
et PRIOCOPIE pour les objets elementaires sont remises a 
j our . 

2) Au tout depart des reorganisations on a : 
TRC = Duree fenetre « batch » k Mb de regions de copie, 
TRR = Duree fenetre « batch » x Nb de regions de 
reorganisation . 




X*a phase ©perstionnelle de Boucle sur ob jets eoaiport© 
les operations siai^rantes : 

5 Pour tout objet reel de la liste PRIOREORG jusqu'a ce 
que TRR < E : 

- Marquer la selection possible 

- toatiler le pointeur de la liste SUPP 

- Initialiser Temps Proviso! re de Copie TPC = TRC 

10 - Initialiser Temps de Reorganisation TR = Duree de 
reorganisation de 1' objet courant OR 

La phase operationnelle d' Elimination des intersections 
d' ob jets comporte les operations suivantes : 

15 

Pour tous les objets globaux associ<£s a 1' objet courant 
OR, Faire : 

Si le pointeur de la liste de selection SEX*ECT/OR de 
1' objet global associe a 1' objet courant est non nul (ce 
20 qui . indique qu' il y a dej£ au moins un objet r6el 
selectionne) , Faire : 

Si la partie planifiee de 1' objet global OG est 
contenue dans la partie planifiee de 1' objet courant 
OR : 

25 Faire pour tout objet reel B de la liste de 

selection : 

Si B marque selectionne alors : 

i) outer le temps additionnel de copie de B au 

TPC 

30 ii) Soustraire la dur6e de reorganisation de B 

du temps de reorganisation TR 

iii) Placer B dans la liste de suppression SUPP 
sinon 

Si la partie planifiee de 1' objet global OG a une 
35 intersection non vide avec la partie planifiee de 
1 ' ob j et courant : 

Marquer selection de 1' objet courant OR 
impossible 
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La phase operationnelle de Remise en cause des choiJJ 
precedents eos^orte les operations suivantes : 

Si selection possible 

Si duree de reorganisation + copie de l'objet 
courant OR > duree residuelle dans la fenetre « batch » 
de dans la region disponible, alors 

Marquar selection de l'objet courant impossible 
Sinon (duree reorg + copie < duree residuelle 

10 « batch ») 

Si le temps de reorganisation (duree de 
reorganisation de l'objet courant) > duree residuelle de 

reorganisation 

Initialiser : gain residuel = gain de l'objet 

15 courant 

Initialiser : temps restant a gagner = duree de 
reorganisation de l'objet courant - duree residuelle de 
reorganisation 

Faire pour tout objet reel B (deja selectionne) 
20 de la liste SELECT /OR en commengant par le precedent de 
l'objet courant OR et dans l'ordre de priorites 
croissantes tant que le limiteur des remises en cause >0 
et que le temps restant a gagner < 0 : 

Si B est selectionne, sans etre sous-objet de 
25 l'objet courant, et si gain B < gain residuel (= gain de 
l'objet courant OR) 

Soustraire le gain de B du gain residuel 
Soustraire la duree de reorganisation de B 

du temps restant a gagner 
30 Ajouter le temps additionnel de copie de B 

au temps provisoire de copie 

Placer B dans la liste de suppression SUPP 
Decrementer le limiteur de remises en cause 
Si le temps a gagner est >0 
35 Marquer selection de l'objet courant 

impossible 




Sinon selection possible soit parce que le temps gagner 
apres 1 ' elimination de B est < 0, soit par ce que temps 
de reorganisation (duree de reorganisation de l'objet 
courant) < duree residuelle de reorganisation. 

5 

La phase operationnelle de Verification de la suffisance 
du temps copie coaaporte las operations suivantes : 

Si selection possible 
10 initialiser : Temps additionnel de copie de 

l'objet courant = temps de copie de l'objet courant 
Si copie a faire pour l'objet courant OR, 

Faire pour tout objet de la liste des objets 
restant a copier (liste PRIOCOPIE) tant que la priorite 
15 de l'objet k copier > £ la priorite de l'objet a 
reorganiser 

Soustraire le temps de copie de l'objet a copier 
du temps provisoire de copie 

Mais si l'objet a copier est un sous-objet de 
20 l'objet courant a reorganiser 

Soixstraire le temps de copie de l'objet & 
copier du temps provisoire de copie temps residuel de 
copie) 

Si le temps additionnel de copie de l'objet 
25 courant > temps provisoire de copie 

Marquer selection de l'objet courant 

impossible 

La phase op^rationnelle de Selection de l'objet courant 

30 coarporte las operations suivantes : 

Si selection possible 

Positionner l'indicateur de selection IndS de 

l'objet courant ; 

Positionner l'indicateur d' affectation de l'objet 
35. global associe a l'objet courant ; 

Woter la partie planifiee PFO de l'objet global 
associe £l 1' objet courant OR; 




Valoriser : pointeur (suite) de selection de 
l'objet courant OR = pointeur liste de selection PointLS 
de l'objet global OG ; 

Valoriser : pointeur liste de selection PointLS de 
5 l'objet global = adresse de l'objet courant OR (l'objet 
courant est ajoute la liste de selection SEI*ECT/OR ) ; 

Soustraire le temps additionnel de copie de 
l'objet courant du temps residuel de copie TRC ; 
10 Soustraire la duree de reorganisation de l'objet 

courant OR du temps residuel de reorganisation TRR ; 

Si le pointeur de liste de suppression est non nul 
Faire pour tout objet reel B de la liste de 
suppression SUPP: 
15 Si B est marque selectionn£ 

&nxmler l'indicateur de selection de B 
Ajouter la dur<§e de reorganisation de B au 
temps residuel de reorganisation TRR. 

20 Nota : il n'est pas utile d'enlever B de la liste de 
selection car seuls les objets reels OR def initivement 
selectionnes et marques par l'indicateur de selection 
seront consideres comme tels et examines par la suite. 

25 B Procliain Objet a Copier 

La recherche du prochain objet a copier est effectuee 
chaque fois qu'une region est lib6ree par une image 
copie terminee ou qu'une region est disponible et qu'un 
30 nouvel objet a ete introduit suite a une reorganisation. 
Les objets doivent etre tries par priorites 
decroissantes et tallies croissantes, les objets 
provenant des reorganisations etant places en tete de 
liste. 

35 

Le planning s'effectue du moins prioritaire au plus 
prioritaire et il est possible qu'un gros objet (longue 
copie) deborde de la region de copie qui lui a ete 
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attribuee. Cette situation est acceptable dans la mesure 
ou l'on s'est assure que 1' objet tenait dans la region 
du point de vue Temps Residuel de Copie et du fait 
qu'une technique valable de planif ication consisterait a 
5 enlever de cette region un objet moins prioritaire deja 
selectionn<§ et de le placer dans une autre region, ce 
qui ne changerait pas la selection pour cette region. 

Le pointeur prochain objet a copier est valorise pour 
10 chaque region, mais pour la raison citee precedemment, 
il est recommande de refaire le planning a chaque fois, 
m§me initialement quand toutes les regions sont 
disponibles- 

15 Enfin il est possible que le planning copie choisisse un 
objet qui n' appartienne pas (encore) a la liste de copie 
parce sa reorganisation n'est pas terminee. Dans ce cas 
on se met en attente (region disponible) . 

20 Le traitement Prochain Objet a Copier comporte les deux 
phases operationnslles suivantes : 
Selection des ofejets a copier 
Re tr ©planning de copie 

25 La phase operationnelle de Selection des objets a copier 

comporte les operations siaivantes : 

Faire un planning rapide de reorganisation PPR*; 

Initialiser les piles de selection de copie a vide ; 

Initialiser : temps residuel de copie TRC = temps total 
30 de fendtre « batch » rest ant disponible dans les regions 

« copie » apres execution des copies en cours ; 

Initialiser EC = minimum (duree unitaire de copie des 

objets a reorganiser OR) 

35 Faire pour toutes les regions de reorganisation, 
Si region active 

Si image copie de l r objet en cours de 
reorganisation a faire , 



Faire pour tout sous-objet pouvant etre copie 

separement (partition) 

Soustraire le temps de copie du sous-objet 

de la duree residuelle de copie 

Placer le sous-objet courant en haut de la 
premiere pile de selection de copie. 

Pair© pour tout objet reel selectionne de la liste des 
objets OR a reorganiser SELECT/OR dans l'ordre des 
priorites decroissantes : 

Si image copie de 1' objet courant OR a faire, 

Fair© pour tout sous-objet pouvant etre copie 

separement (partition) 

Soustraire le temps de copie du sous-objet de 

la duree residuelle de copie 

Placer le sous-objet courant en haut de la 

premiere pile de selection de copie. 

Fair© pour tout objet de la liste des objets a copier OC 
dans l'ordre des priorites decroissantes, tant que la 
duree residuelle de copie TRC > EC 

Si le temps de copie de 1' objet OC < duree 

residuelle de copie TRC, 

Si 1' objet a copier OC n'est pas deja dans la 
premiere pile " (1' objet OC est un sous-objet; 
verification possible par test de la partie reorganisee 
de 1' objet global en cas de partition), 

Soustraire le temps de copie du sous-objet de 

la duree residuelle de copie 

Placer le sous-objet courant en haut de la 

seconde pile de selection de copie. 

Placer la premiere pile de selection de copie sur la 
seconde (constituant ainsi la liste SELECT/COPIE) . 

La phase operationnelle de Retroplanning de copie 
con^>orte lea operations suivantes : 
Faire pour toute region de copie : 



Duree de la region = Dur§e de la fenetre - heure 
relative estimee de fin de traitement en cours dans la 
region 

Duree consommee region == 0 

Initialiser le premier pointeur objet a copier de 
la region courante a 0, 

Faire de haut en bas pour tout objet de la pile de 
selection de copie : 

Si temps de copie de 1' objet courant OC < duree de 
la region la plus longue ; 

Rechercher une region dont la duree consommee 

est minimale ; 

Si temps de copie de 1' objet OC > duree de la 
region courante - duree consommee 

Recixercl&er une region pour laquelle. : duree 
de la region - dur§e consommee de la region - temps de 
copie de 1' objet courant soit minimal et positive ou 
nulle r 

Si aucune region ne convient 

Rechercher une region pour laquelle : 
dur^e de la region - duree consommee de la region -temps 
de copie de 1' objet courant soit maximale (c.a.d 
minimale en valeur absolue) et le temps de copie de 
1' objet courant < duree de la region, 

Si 1' objet courant OC appartient £ la seconde 

pile, 

Valoriser : pointeur premier objet a copier POC 
de la region courante = adresse de 1' objet courant OC, 

Ajouter la dur6e de copie de OC a la duree 
consommee de la region courante. 

C Procliain Objet a Reorganises 

La recherche du prochain objet a rdorganiser est 
effectuee chaque de fois qu'une region, est liberee par 
une reorganisation terminee. Pr6alablement les priorites 
ont du etre calculees ou corrigees et les objets reels 
tries dans l'ordre des priorites decroissantes . 
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Comiae pour la copie, le planning s'effectue du moins 
prior itaire au plus prior it aire. On commence par 
planifier les copies engendrees par les reorganisations, 
ce qui permet de calculer une heure limite de fin de 
reorganisation pour chaque objet devant etre copie. 

Le temps disponible de chaque region de reorganisation 
est divise en trois parties : 

1 - la duree consommee ef fectivement par les 
reorganisations planifiees 

2 - la duree gaspillee par le temps reserve a la copxe 
apres reorganisation 

3 - la duree residuelle allant du debut a la premiere 
reorganisation 

Le processus tente de remplir la duree gaspillee par des 
reorganisations d'objets ne necessitant pas de copie. 

Quand un objet a reorganiser est selectionne, il est 
retire de la liste ainsi que ses index (si applicable) 
et tous les autres objets qui ont des partitions 
communes avec cet objet. Les priorites des autres objets 
pouvant partager un index avec celui-ci sont egalement 
recalculees (pour tenir compte de 1' impact de la 
reorganisation de 1' index) et ces objets sont replaces 
aux bons endroits dans la liste des objets reels a 
reorganiser. 

traitement Prochain Objet a Reorganiser comport© les 
guatre phases operationnelles suivantes : 
Retroplanning de copie 
Retroplanning de reorganisation 
Identification de la region de traitement 
Inscription de 1' objet an planning 

La phase operationnelle de Retroplanning de copie 
comporte les operations suivantes : 




Faire un planning rapide 

Faire pour toute region de copie : 

Duree consommee de la region = 0 
Faire pour tout objet reel OR selectionne de la liste 
5 des reorganisations SELECT/OR (dans l'ordre des 
priorites croissantes ) 

Initialiser : * temps a reserver pour copie de 
1' objet courant '= 0 

Si image copie de 1' objet courant OR a faire, 
10 Faire pour tout sous-objet pouvant etre copie 

separement (partition) r 

Recharcher une region dont la duree consommee 
est minimale, ci-apres region courante 

Ajouter le temps de copie du sous-objet & la 
15 duree consommee de la region courante , 

Valorise*: ''temps a reserver pour copie de 
1' objet courant' = mass (temps a reserver pour copie de 
1' objet courant OR, duree consommee de la region 
courante) 

20 

X*a phase operationnelle de RefcropXarming de 
reorganisation coioporte les operations suivantes : 
Faire pour toute region de reorganisation : 

Duree de la region = Duree de la fenetre - heure 
25 relative estimee de fin du traitement en cours dans la 
region - 

Duree consommee dans la region = 0 
Duree gaspillee dans la region = 0 

Point eur premier objet a reorganiser de la region 
30 courante = 0 

Faire pour tout objet reel OR selectionne de la liste 
SELECT/OR dans l'ordre des priorites croissantes : 
Faire pour chaque region 

Si 1' image copie de 1' objet courant OR a faire, 
35 Calculer dernier delai de la region = duree 

de reorganisation de l r objet courant + man de [temps a 
reserver pour copie de 1' objet courant, (duree consommee 
de la region + duree gaspillee de la region) ] 
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Sinon, 

Calculer le dernier delai de la region = 
duree consommee de la region + mas de [ (duree de 
reorganisation de l'objet courant, duree gaspille de la 
region) ] 

La phase operationnelle de Identification de la region 
de traitement comporte les operations suivantes : 
Rechercher une region dont le delai est minimal, 
Si dernier delai de la region courante > duree de la 

region courante, 

Bechercher une region pour laquelle : [duree de la 
region courante - dernier delai de la region courante] 
est minimale et positive ou nulle, 
Sinon , si aucune region ne convient, 

Rechercher une region telle que : [valeur absolue 
de (duree de region - dernier delai de la region 
courante)] est minimale, et [duree de reorganisation + 
copie ob jet courant] < duree de la region. 

La phase operationnelle de Inscription de l'objet an 
planning comporte les operations suivantes : 

Si image copie de l'objet courant OR a faire ou duree 
gaspillee de la region courante = 0, 

Valoriser: pointeur premier objet a reorganiser 
POR de la region courante = adresse de l'objet courant 
OR, 

Ajouter la duree de reorganisation de l'objet courant OR 
a la duree consommee de la region courante, 
Valoriser : duree gaspillee de la region courante = 
dernier delai de la region courante - duree consommee de 
la region courante. 

Lorsque l'une des deux regions de traitement identifiees 
concernees (reorganisation ou copie) devient disponible, 
le systeme lancera, en 1' absence de tout evenement de 
remise a zero RAZR=1 ou RRZC=1 survenu entre temps pour 
le traitement concerne, soit une reorganisation de 




1' ob jet POR (prochain objet a reorganiser) 
correspondant, soit une copie de 1' objet POC 
correspondant (prochain objet a copier) „ 

5 Une f ois le traitement lance le processus 
d' identification IDPQR et/ou XDPOC reprendra, les listes 
PRIOREORG et PRXOCOPIE etant mises a jour en continue,. 
jusqu'£ <§puisement du temps de reorganisation et/ou de 
copie impart i aux di verses regions de reorganisation et 

10 de copie correspondantes dans la fenetre « Batch »• 

Bien entendu la methode de gestion des reorganisations 
et de copies dans un ensembles de bases de donnees 
indexees d'un systeme d' information selon 1' invention 
15 n'est pas limitee au mode de mise en oeuvre decrit ci- 
dessus et couvre d' autres variantes et modifications qui 
ppurraient etre appreciees par l'homme de metier tout en 
restant dans le cadre des revendications presentees ci- 
apr6s. 

20 

En particulier la methode de gestion selon 1' invention 
utilisee pour a la reorganisation « hors ligne » (off 
line) des bases de donnees est egalement applicable a la 
reorganisation des bases de donnees « en temps reel » ou 
25 « en ligne » (on line) selon une methode mixte, la 
reorganisation « hors ligne » et la reorganisation « en 
ligne » n' etant pas exclusive l'une de 1' autre. 
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REVENDICATIONS : 
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1 Methode de gestion des reorganisations dans un 
ensemble de bases de donnees indexees d'un systeme 
informatique d' information adaptee a la reorganisation 
« hors ligne » dans au moins une region de traitement de 
reorganisation du systeme, caracterisee en ce qu'elle 
comporte les phases operationnelles suivantes : 
(10) - Creation et maintien par mise a jour en continu 
d'une liste PRIOREORG des objets a reorganiser par 
priorite decroissante fonction de l'etat de 
desorganisation des objets a reorganiser ; 
(20) - Execution du processus IDPOR d' identification du 
premier ou prochain objet a reorganiser POR avec, a 
chaque evenement RASR=1 interne au systeme pour lequel 
la selection du premier ou prochain objet a reorganiser 
doit etre remise en cause, interruption et remise a zero 
et nouvelle execution du processus IDPOR, lequel 
processus comportant les etapes suivantes : 

(21) - Etablissement d'un planning rapide de 
reorganisation PRR a l'aide de la liste PRIOREORG et du 
temps operational residuel disponible TRR dans 
1' ensemble des regions de reorganisation et d'une liste 
de selection SEISCT/OR d' objets a reorganiser OR 
ordonnes par priorites decroissantes optimisees en 
fonction du gain de la reorganisation de chaque objet 
OR, ledit gain etant defini comme le produit d'un 
facteur representatif du taux de desorganisation d'un 
objet OR par le temps de reorganisation de cet objet; 

(22) - Etablissement d'un retroplanning de 

reorganisation dans lequel pour tout objet courant a 
reorganiser OR extrait de la liste SEI*CT/OR par 
priorite croissante pour favoriser le traitement avance 
des objets de plus grandes tallies possibles, on calcule 
pour chaque region de reorganisation le dernier delai de 
la region DDRR, representant dans la fenetre « batch » 
allouee a la reorganisation « hors ligne » le temps 
minimal necessaire a la reorganisation de 1' objet 




courant OR, egal dans le cas present a la duree de temps 
consomme DCRR plus le temps de reorganisation de l'objet 
courant DROR; 

(23) - Identification de la region de traitement RTR 
5 de l'objet courant OR par adequation optimisee entre la 
dur<§e de traitement disponible dans ladite region DRR 
avec la duree de traitement DROR necessaire pour la 
reorganisation de l'objet POR avec DRR - DDRR 
minimal <0 ; 

10 (24) - Inscription de l'objet courant OR comme 

prochain objet a reorganiser FOR au planning de la 
region identifiee en valor isant le point eur POR 
correspondant a 1'adresse de l'objet courant OR et en 
augmentant la duree de temps consomme DCRR dans la 

15 region du temps de la reorganisation DROR. 

(30) - Lancement de la reorganisation de l'objet POR des 
que la region de traitement de reorganisation RTR 
identifiee est liberee en 1' absence de tout evenement 
K&SR=1 survenu entre temps ; Remise a zero et nouvelle 

20 execution du processus IDPOR* 

2. Methode de gestion selon la revendication 1, 
caracterisee en ce l'ordre optimal des reorganisations 
est coordonne avec l'ordre des copies de sauvegarde 

25 d'objets du systerae d' information en tenant compte des 
reorganisations en cours ou juste effectuees. 

3. Methode de gestion selon la revendication 2, 
caracterisee en ce que l'ordre des copies de sauvegarde 

30 est modifie par 1' execution en premiere prior ite, pour 
au moins un objet a reorganiser OR f de la copie dudit 
objet OR au plus tot en fin de traitement de 
reorganisation . 

35 4. Methode de gestion des reorganisations d'un ensemble 
de bases de donnees indexees d'un systeme d' information 
adaptee a la reorganisation « hors ligne » dans au moins 
une region de traitement de reorganisation selon l'une 




des revendications 1 a 3, caracterisee en ce qu'elle 
integre 1' organisation des copies dans au mo ins une 
region de traitement de copie et comporte les phases 
operationnelles suivantes : 
5 (40) - Creation et maintien par raise £ jour en continu : 

- d'une liste PRIOREORG des objets a reorganiser par 
priorite decroissante fonction de l'etat de 
disorganisation des objets a reorganiser ; et 

- d'une liste PRIOCOPIE des objets a copier par 
10 priorite decroissante fonction de l'anciennete des 

dernieres copies des objets a copier. 

(50) - Surveillance en continu de 1' apparition dans le 
systeme d' information de tout evenement : 

- RASR=1 pour lequel la selection du premier ou 
15 prochain objet £ reorganiser POR doit etre remise en 

cause, notamment une fin d'une tache de 
reorganisation dans une region de traitement de 
reorganisation et/ou la liberation d'une zone de 
traitement pour la reorganisation ou la copie ; et/ou 

20 - RA2C—X pour lequel la selection du premier ou 

prochain objet & copier POC doit §tre remise en 
cause, notamment une fin d'une t^che de copie dans 
une region de traitement de copie, une copie 
prioritaire en fin de reorganisation et/ou la 

25 liberation d'une zone de traitement pour la 

reorganisation ou la copie , 
avec 

pour tout evenement RA2R=1, lancement de 1' execution du 
processus IDPOR d' identification du premier objet a 
30 reorganiser POR ou f si le processus XDPOR est en cours 
d' execution, interruption et nouveau lancement du 
processus IDPOR ; et/ou 

pour tout Evenement RAZC=1, lancement de 1' execution du 
processus IDPOC d' identification du premier objet a 
35 copier POC ou, si le processus IDPOC est en cours 
d' execution, interruption et nouveau lancement du 
processus IDPOC ; 




- le processus XBPOR comportant les operations 
suivantes : 

(51) - Etablissement d' un planning rapide de 
reorganisation PRR* a l'aide de la liste PRXOR&ORS et du 

5 temps operationnel de reorganisation residuel disponible 
TRR dans 1' ensemble des regions de reorganisation et 
d f une liste de selection SEIbECT/OR d'objets a 
reorganiser OR ordonnes par priorites decroissantes 
optimisees en fonction du gain de la reorganisation de 

10 chaque objet OR, ledit gain etant defini comme le 
produit d'un facteur representatif du taux de 
disorganisation d'un objet OR par le temps de 
reorganisation de cet objet; 

(52) - Etablissement d'un planning rapide de copie 
15 PRC a partir de la liste SKLECT/OR, puis de la liste 

PRXOCOPIE et dans la limit e du temps operationnel de 
copie residuel disponible TRC dans 1' ensemble des 
regions de copie, d'une liste de selection SEXJSCT/OC en 
memoire de type LIFO ou pile pour d'objets a copier OC 
20 empil<§s par priorites decroissantes; 

(53) - Etablissement d'un retroplanning de copie dans 
lequel pour tout objet courant a reorganiser extrait de 
la liste SELECT/OR par priorite croissante, on calcule 
pour chaque region de copie le temps a reserver TCR pour 

25 la copie de 1' objet OR apr§s reorganisation ; 

(54) - Etablissement d'un retroplanning de 
reorganisation dans lequel pour tout objet courant a 
reorganiser OR extrait de la liste SEItECT/OR par 
priorite croissante pour favoriser le traitement avance 

30 des objets de plus grandes tallies possibles , on calcule 
pour chaque region de reorganisation le dernier d<§lai de 
la region DDR, repr^sentant dans la fenetre « batch » 
allouee a la reorganisation « hors ligne » le delai 
minimal necessaire a la reorganisation de 1' objet OR, 

35 selon une formulation distincte si une copie de 1' objet 
OR en fin de reorganisation doit etre faite ou non; 

(55) - Identification de la region de traitement RTR 
de l r objet courant OR par adequation optimisee entre la 
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duree de traitement disponible dans ladite region DRR 
avec la duree de traitement DROR necessaire pour la 
reorganisation de 1' objet courant OR avec DRR — DDL 
minimal <0 sans copie a faire ou avec valeur absolue de 
DRR - DDI. minimal et DROR+DCOR < DRR si copie a faire ; 

(56) - Inscription de 1' objet courant OR comme 
prochain objet a reorganiser POR au planning de la 
region identifiee en valorisant le pointeur POR 
correspondant a l'adresse de 1' objet OR, en augmentant 
10 la duree de temps consomme DCRR dans la region du temps 
de la reorganisation DROR et recalculant la duree 
gaspillee dans la region de reorganisation DGRR du fait 
des copies d'objets OR en fin de reorganisation ; 

60)- Lancement, en 1' absence de tout evenement de 
15 remise a zero RAZR=1 survenu entre temps, des qu'une 
region de traitement de reorganisation RTR identifiee 
est disponible, de la reorganisation de 1' objet POR ; 
Remise a zero et nouvelle execution du processus IDPOR ; 
et, 

20 - le processus IDPOC comportant les operations 
suivantes : 

(51) - Etablissement d'un planning rapide de 
reorganisation PRR* a l'aide de la liste PRIOREORG et du 
temps operationnel de reorganisation residuel disponible 

25 TRR et d'une liste de selection SELECT/OR d'objets a 
reorganiser OR ordonnes par priorites decroissantes 
optimisees en fonction du gain de la reorganisation de 
chaque objet OR, ledit gain etant defini comme le 
produit d'un facteur representatif du taux de 

30 desorganisation d'un objet OR par le temps de 
reorganisation de cet objet; 

(52) - Etablissement d'un planning rapide de copie 
PRC a partir de la liste SELECT /OR, puis de la liste 
PRIOCOPIE et dans la limite du temps operationnel de 

35 copie residuel disponible TRC, d'une liste de selection 
SELECT/OC en raemoire de type LIFO ou pile d'objets a 
copier OC empires par priorites decroissantes; 




(53') - Etablissement d'un retroplanning de copie 
avec determination des durees de copie disponibles en 
region copie, depilage de la liste SELECT/OC de haut en 
bas et recherche d'une region copie par adequation entre 
5 la duree copie disponible et la duree copie de l'objet 
courant a copier OC de fagon a copier les objets les 
plus grands possibles et marquage de 1'origine de 
reorganisation ou non de l'objet £ copier ; suivi de 

- 1' identification de la region de traitement RTC de 
10 l'objet a copier par adequation entre la duree de 

traitement disponible dans ladite region avec la duree 
de traitement necessaire pour la copie de l'objet 
courant OC; suivie de 

- 1' inscription de l'objet courant OC comme le prochain 
15 ob jet a copier POC au planning de la region RTC 

identifiee en valorisant le pointeur FOC correspondant a 
l'adresse de l'objet OC et en diminuant la duree de 
traitement disponible du temps de la copie de l'objet OC 
retenu comme POC ; 
20 ( 60')- Lancement, en 1' absence de tout evenement de 

remise a zero R&2C=X survenu entre temps, des qu'une 
region de traitement de copie TRC identifiee est 
disponible de la copie de l'objet POC; Remise a zero et 
nouvelle execution du processus IDPOC. 

25 

5. Methode de gestion selon la revendication 4, 
caracterisee en ce qu'elle integre dans les phases 
finales de processus IDPOR d'un objet OR une phase de 
recherche d'un ou plusieurs objets a reorganiser OR sans 

30 copie OR dans la liste SEIaECT/OR ou a defaut dans la 
liste PRIOREORG susceptibles d'etre reorganises dans la 
region de traitement RTR correspondante pendant 
l'intervalle du temps d'attente de la copie de l'objet 
OR apr&s reorganisation. 

35 

6. Methode de gestion selon l'une des revendi cations 4 
et 5, caracterisee en ce que ladite phase (51) 
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d' etablissement d'un planning rapide de reorganisation 
PKR* comporte les operations suivantes : 

(511) - initialisation : dans laquelle sont notamment 
annules les indicateurs de selection des objets OR, 
initialise le compteur-limiteur de remises en causes, 
les temps residuels de copie TRC et de reorganisation 
TRR et la duree minimale E de reorganisation et copie 
d'un objet OR ; 

(512) - Boucle sur objets : dans laquelle notamment pour 
tout objet reel OR de la liste PRIOREORG pris dans 
rordre decroissant jusqu'a ce que TRR < E, une marque 
de -selection possible' de 1' objet est posee; 

(513) - Elimination des intersections d'objets : dans 
laquelle notamment sont elimines de la Election 
possible' les objets reels OR parties d'espaces de 
tables egalement appeles objets globaux deja 
selectionnes en tout ou partie; 

(514) - Remise en cause des choix precedents : dans 
laquelle notamment sont elimines de la Selection 
possible' les objets OR dont le temps total de 
reorganisation et copie est superieur au temps de 
reorganisation residuel TRR et a defaut dans laquelle 
1' objet courant OR et les objets OR deja selectionnes 
dans la liste SEIJ3CT/OR sont sounds a un processus 

25 d' optimisation en fonction du gain de reorganisation 
avec replacement d'un objet deja selectionne par l'ob D et 
en cours avec essais, dans la limite du terme du 
compteur-limiteur, de combinaisons successives tendant a 
retenir pour etre selectionne au final dans SELECT/OR 
des objets de plus grand gain de reorganisation possible 
et a les associer aux autres objets OR de la -selection 
possible' de facon a ce que le temps total des 
reorganisations de tous les objets OR retenus soit 
inferieur mais le plus proche possible du temps residuel 
35 de reorganisation TRR. 

(515) - Verification de la suffisance du temps copie 
disponible dans le temps residuel de copie TRC pour 
chaque objet OR en passe d'etre finalement selectionne 
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pour la reorganisation compte tenu de la priorite de 
reorganisation de l'objet OK par rapport aux objets a 
copier en prealable du fait de leurs priorites copie 
superieures . 

5 (516) - Selection de l'objet courant OR dans la liste 
SEX.ECT/OR : dans laquelle notarament sont positionnes les 
indicateurs de l'objet courant OR et de l'objet global 
associe, annules eventuellement les indicateurs du ou 
des objets OR deselectionnes et diminuer TRR et TRC des 

10 temps respectifs de reorganisation et de copie. 

7. Methode de gestion selon l'une des revendications 4 a 
6 caracterisee en ce que ladite phase (52) 
d' etablissement d'un planning rapide de copie PRC 
15 comporte les operations suivantes: 

(521) - Initialisation : au sortir d'un planning de 
reorganisation PRR* et dans laquelle sont notamment 
videes les piles de selection de copie PSC1 et PSC2, 
initialises le compteur-limiteur de remises en causes, 

20 le temps residuel de copie TRC et la duree minimale EC 
de copie d'un objet a copier OC ; 

(522) - Inspection des regions de reorganisation : Pour 
toutes les regions, 

si region active, et si image copie de l'objet en cours 
25 de reorganisation a faire et/ou si image copie de tout 
objet OR de la liste SELECT/OR pris dans l'ordre des 
priorites decroissantes a faire: pour tout sous-objet 
susceptible d'etre copie s6parement, notarament une 
partition, soustraction du temps de copie du sous-objet 
30 de TRC et placement du sous-objet en haut de la premiere 
pile PSC1 ; 

(523) - traitement de la liste des objets a copier 
PRXOCOPXE : dans laquelle notamment pour tout objet a 
copier OC de la liste PRIOCOPIE pris dans l'ordre 

35 decroissant jusqu'a ce que TRC < EC et absent de PSCl, 
soustraction du temps de copie du sous-objet OC de TRC 
et placement du sous-objet OC en haut de la seconde pile 
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(524) - Eitipilage des piles de selection : dans laquelle 
la pile PSC1 est superposee a la pile PSC2 pour 
constituer la liste SSLECT/OC. 

8 Methode de gestion selon la revendication 7 
caracterisee en ce que ladite phase (53) d' etablissement 
d'un retroplanning de copie dans le processus IDPOR 
comporte les operations suivantes: 

(531) initialisation des regions de copie : dans 
laquelle au sortir d'un planning de reorganisation pour 
toutes les regions de copie, la duree consommee de la 
region DCRC est mise a zero, 

(532) Determination du temps de copie a reserver TCR : 
dans laquelle pour tout objet reel de la liste SEIECT/OR 
parcourue dans l'ordre des priorites croissantes prrs 
comme objet courant a reorganiser OR, 

-le temps a reserver pour copier TCR 1' objet reel 
courant OR est mis a zero ; 

-Si 1' image copie de tout objet OR de la liste SEIECT/OR 
pris dans l'ordre des priorites croissantes doit etre 
faite: pour tout sous-objet susceptible d'etre copie 
separement, notamment partition, on recherche une region 
copie dont la duree consommee DCRC est minimale, on 
ajoute le temps de copie du sous-objet a la duree 
25 consommee de la region courante DCRC et on valorise le 
temps a reserver TCR pour copie de 1' objet courant - 
.naximum entre le temps a reserver TCR pour copie de 
1' objet courant et duree consommee dans la region DCRC. 

30 9 Methode de gestion selon la revendication 8, 
caracterisee en ce que ladite phase de retroplanning de 
reorganisation (54) dans le processus IDPOR comporte les 
operations suivantes : 

(541) - Initialisation : dans laquelle pour toute region 
35 de reorganisation, 

- Duree de la region DRR = Duree de la fenetre ^batch' 
DFB moins heure relative estimee de fin du traitement de 
reorganisation en cours dans la region HRER 
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- Duree consommee dans la region DCRR = 0 

- Duree gaspillee dans la region DGRR = 0 

- Pointeur premier objet a reorganiser de la region 
courante = 0 

5 (542) - Determination du dernier delai de la region de 
reorganisation DDRR : dans laquelle pour tout objet reel 
OR selectionne de la liste SELECT/OR dans l'ordre des 
priorites croissantes : 

Pour chaque region si 1' image copie de 1' objet courant 
10 OR a faire, calcul du dernier delai de la region DDRR = 
duree de reorganisation de 1' objet courant DROR + 
maximum entre le temps a reserver pour copie de 1' objet 
courant TCR et le total de la duree consommee de la 
region DCRR + la duree gaspillee de la region DGRR ; 
15 - Sinon f calcul du dernier delai de la region DDR « 
duree consommee de la region DCRR + maximum entre la 
duree de reorganisation de 1' objet courant DROR et la 
duree gaspillee de la region DGRR. 

20 10. Methode de gestion selon la revendication 9, 
caract^risee en ce que ladite phase d' identification de 
la region de reorganisation RTR (55) comporte les 
operations suivantes : Selon le type d' objet courant a 
reorganiser OR 

25 ( 551) - Recherche de la region de traitement de 
reorganisation susceptible d' accueillir de f agon 
optimale un objet a reorganiser OR sans copie : 
comportant 

- la recherche d'une region dont le dernier delai DDRR 
30' est minimal, et si dernier delai de la region courante 

DDR est siapearieur a la duree de la region courante DRR, 
la recherche d' une region pour laquelle : la valeur de 
la duree de la region courante DRR moins le dernier 
delai de la region courante DDRR est minimale @fc 
35 positive cm nulla ; sinon 

(552) - la recherche de la region de reorganisation 
susceptible d' accueillir de fapon optimale un objet a 
reorganiser OR avec copie : comportant 
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- Recherche d'une region telle que : la valeur de la 
duree de la region DRR moins dernier delai de la region 
courante DDRR est lainimale en valeur absolue, et la 
valeur de la duree de reorganisation DROR plus le temps 
5 de copie objet courant TCR est inferieur ou 6gal a la 
duree de la region DRR. 

11. Methode de gestion selon la revendication 10, 
caract^risee en ce que ladite phase d' inscription de 
10 1' objet OR au planning de la region de reorganisation 
RTR (56) comporte les operations suivantes : 

(561) - Inscription de 1' objet OR comme prochain objet a 
reorganiser POR : dans laquelle si 1' image copie de 
1' objet courant £ faire ou duree gaspillee de la region 

15 courante egale zero, on valorise le pointeur premier 
objet a reorganiser POR de la region courante a 
l'adresse de 1' objet courant OR, 

(562) - mise a jour DCKR et DGRR : dans laquelle on 
ajoute la duree de reorganisation de 1' objet courant 

20 DROC a la duree consommee de la region courante DCRR, et 
on valorise la dur£e gaspillee de la region courante 
DGRR a la valeur du dernier delai de la region courante 
DDRR moins la duree consommee de la region courante 
DCRR. 



12, Methode de gestion selon 1'une des revendi cat ions 4 
a 7 caracterisee en ce que ladite phase <53' ) 
d' etablissement d' un retroplanning de copie dans le 
processus IDPOC comporte les operations suivantes: 
30 (531') Initialisation des regions de copie : dans 
laquelle pour toutes les regions, 

- la duree de region DRCOP est valorisee a la duree 
fenetre « batch » DWB moins l'heure relative estiniee de 
fin de traitement copie en cours HRFC, 

35 - la duree consommee de la region DCRCOP est mise a 
zero, 

- le pointeur du premier objet a copier POC de la region 
courante est mis a zero 
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(532' ) Depilage et identification du prochain objet & 
copier POC : Dans la laquelle, 

Pour tout objet de la pile PSCX/PSC2 parcourue de haut 
en bas un objet courant a copier OC est extrait lorsque 
5 le temps de copie de 1' objet courant TCOC est inferieur 
ou egal & la Xongue DRCOP; 

On cherche pour identifier la region de traitement copie 
une region dont la duree consonance DCRCOP est minimale ; 
dans 1' affirmative si le temps de copie de 1' objet 

10 courant TCOC est superieur a DRCOP moins DCRCOP on 
cherche une region pour laquelle DRCOP moins DCRCOP 
moins TCOC est minimale, positive ou nulle, 
Si aucune region ne convient, on choisit une region a 
copier pour laquelle DRCOP moins DCRCOP moins TCOC est 

15 negative et minimale en valeur absolue et pour . laquelle 
TCOC est infer ieur ou egal a DRCOP ; 

Si 1' objet courant appartient a la seconde pile PSC2, 
soit un objet a copier non issu d'une reorganisation le 
pointeur de 1' objet POC pour la region courante choisie 
20 est valorise a 1'adresse de 1' objet courant OC de fa?on 
£ inscrire 1' objet POC au planning de la region de 
traitement copie RTC identifiee ; et 

Pour terminer , on ajoute la duree copie TCOC a la duree 
consomm<§e de la region courante DCRCOP. 



13. Methode de gestion selon l'une de revendications 
precedentes, caracterisee en ce que lesdits evenements 
internes au systeme R&SR=1 et R&RC=X entrainant la 
remise en cause de la selection des objets POR ou POC 

30 sont notamment constitues respect ivement par la fin 
d'une tache de reorganisation dans une region de 
traitement de reorganisation pour les objets POR ou par 
la fin d'une tache de copie dans une region de 
traitement de copie pour les objets POC, une copie 

35 prioritaire en fin de reorganisation et/ou la liberation 
d f une zone de traitement pour les objets POR et POC. 
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14. Mithode de gestion des reorganisations d'un ensemble 
de bases de donnees indexees d'un systeme informatique 
d' information adaptee a la reorganisation « en ligne » 
et destinee a travailler en association avec une mithode 
de gestion selon l'une des revendications precedentes, 
caractirisie en ce qu'elle comporte au moins les phases 
operationnelles suivantes : 

- une phase d' analyse instantanee d'au moins un objet a 
reorganiser OR parmi les objets susceptibles de 
reorganisation, notamment bases de donnees, partitions 
et/ou index a reorganiser, et d' estimation du surcoat 
associe au niveau de disorganisation de 1' objet a 
reorganiser OR; 

- une phase d' estimation instantanee du cout de la 
reorganisation en ligne en fonction de la taille dudit 
objet a reorganiser OR et du taux de disorganisation 
dudit objet a reorganiser OR ; et 

- une phase de determination du seuil Ds de 
disorganisation minimal de 1' objet a reorganiser OR au 
dessus duquel seuil la reorganisation « en ligne » peut 
etre lancee pour cet objet OR et le cas echeant du 
lancement effectif de cette reorganisation en ligne, le 
seuil Ds correspondant sensiblement au minimum du cout 
total du surcout estime de la disorganisation et du cout 
estimi de la riorganisation pour 1' objet OR considiri. 

15. Methode de gestion des reorganisations « en ligne » 
selon la revindication 14, caractirisie en ce que le 
lancement de la riorganisation « en ligne » est retardi 
pour attendre une fenetre temporelle d'activiti riduite 
de la base de donnies concernie. 

16. Methode de gestion des riorganisations « en ligne » 
et « hors line » selon l'une des revendications 14 et 
15, caractirisie en ce que pour un objet a riorganiser 
OR silectionni comme premier objet a riorganiser POR la 
prioriti est donnie pour la riorganisation « hors 
ligne », 1' intervention de la riorganisation « en 
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ligne » n r etant requise qu'apres depassement du seuil Ds 
pour 1' objet FOR considere. 

17 . Methode de gestion des reorganisations « en ligne » 
5 selon 1'une des revendications 14 a 16 et utilisee pour 

la reorganisation des bases de donnees indexees de type 
espace de tables , la methode etant caracterisee en ce 
que pour un objet a reorganiser OR, le seuil Ds est 
defini par une approximation donnee par la formule F5' 
10 suivante : 

R - Ds 2 xr Co* / 2.I-C = 1 

lorsque que U moyenne horaire du nombre de mises a jour 

sur 1' objet OR est faible, et dans laquelle : 

ar designe le nombre moyen de lignes ou cle-RID par page 

15 de 1' objet entier, 

I designe le nonibre d' insertions de lignes , ou de cle- 
RID pour les index, a l'heure dans 1' objet OR, 
Co* designe le surcout horaire lorsque 1' objet est 
totalement desorganise 

20 c designe un parametre machine, le rapport du temps 
d'acces E/S par la taille de 1' objet 38fop. 

18. Methode de gestion des reorganisations « en ligne » 
selon la revendication 17 et utilis§e pour 'la 

25 reorganisation des index, caracterise en ce que pour un 
index, le seuil DsX est defini par une approximation 
donnee par la formule F7 r suivante : 
R= Dsl 2 r (t*+l)M>p.V / [2 (V+3) ] = 1 

lorsque que U moyenne horaire du nombre de mises a jour 
30 sur 1' index est faible, et dans laquelle : 

Ts designe le temps de deplacement de bras, Tl le temps 
de latence (1/2 tour du bras) . 

c == (Ts+ 3.Tl)/EIfop ou Ts en E/S designe le temps de 
deplacement du bras du disque, et Tl le temps de 
35 latence, 1/2 tour du bras, et V = Ts/Tl. 

t* designe le taux de relecture de 1' objet, c'est k dire 
le nombre moyen de fois qu'une entree sera relue. 
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19. Methode de gestion des reorganisations « en ligne » 
selon la revendication 17 et utilisee pour la 
reorganisation des bases de donnees indexees de type 
espace de tables monotable a sx index, caracterise en ce 
que le seuil DsT est def ini pour un espace monotable par 
une approximation donnee par la formule F13' suivante : 
R= r.NbptDsT 2 .L (V+l) + V. S <DsT 2 -bi 2 > <t*i+l) ] / (2V+6) 
= 1 

lorsque que U, moyenne horaire du nombre de mises a jour 

sur 1' espace monotable est faible, et dans laquelle : 

L designe la proportion de lignes accedees par parcours 

sequentiel sur le nombre de lignes creees, 

E represente le signe mathematique Sigma, somme des 

expressions f (xi) pour i index allant de 1 a n, 

bi representent les valeurs instantanees de D, taux de 

disorganisation de 1' espace monotable, lors des 

dernieres reorganisations des n index, et 

t*i representent les taux d'acces directs au travers de 

chaque index x. 

20. Methode de gestion des reorganisations dans un 
ensemble de bases de donnees indexees d'un systeme 
informatique d' information selon l'une des 
revendications precedentes, caracterisee en ce qu' elle 
est appliquee a la reorganisation de bases de donnees 
indexees de type espace de tables. 

21. Systeme informatique de type systeme d' information 
caracterise en ce qu'il comporte un ensemble de bases de 
donnees indexees et les moyens materiels et logiciels 
adaptes pour la mise en oeuvre de la methode de gestion 
des reorganisations de base de donnees indexees selon 
l'une des revendications precedentes, notamment de bases 
de donnees de type espace de tables et/ou d' index. 
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